清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 DeepSeek 从入门到精通Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? 网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通?0 码力 | 103 页 | 5.40 MB | 8 月前3
JavaScript 正则表达式迷你书 老姚 - v1.1真实案例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 7.3.1. 使用构造函数生成正则表达式 . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 7.3.2. 使用字符串保存数据 . . . . . . . . . 本书采用 Asciidoc 格式编写。 使用 Asciidoctor 构建本书电子版。 教程: • 语法教程 • 转换PDF教程 书中用的可视化图片是由 Regulex 正则表达式可视化工具生成。 其余图片是由 Processon 制作。 JavaScript 正则表达式迷你书 前言 | 第 1 页 意见和疑问 如果有意见或者问题的话,可以直接通过以下方式联系到我。 • 前端网 escapeHTML('Blah blah blah') ); // => "<div>Blah blah blah</div>"; 其中使用了用构造函数生成的正则,然后替换相应的格式就行了,这个跟本章没多大关系。 倒是它的逆过程,使用了括号,以便提供引用,也很简单,如下: JavaScript 正则表达式迷你书 3. 第三章 正则表达式括号的作用0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0真实案例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 7.3.1. 使用构造函数生成正则表达式 . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 7.3.2. 使用字符串保存数据 . . . . . . . . . 本书采用Asciidoc格式编写。 使用 Asciidoctor 构建本书电子版。 教程: • 语法教程 • 转换PDF教程 书中用的可视化图片是由 Regulex 正则表达式可视化工具生成。 其余图片是由 Processon 制作。 JavaScript 正则表达式迷你书 前言 | 第 1 页 意见和疑问 如果有意见或者问题的话,可以直接通过以下方式联系到我。 • 前端网 escapeHTML('Blah blah blah') ); // => "<div>Blah blah blah</div>"; 其中使用了用构造函数生成的正则,然后替换相应的格式就行了,这个跟本章没多大关系。 倒是它的逆过程,使用了括号,以便提供引用,也很简单,如下: JavaScript 正则表达式迷你书 3. 第三章 正则表达式括号的作用0 码力 | 89 页 | 3.42 MB | 11 月前3
消息中间件RocketMQ原理解析 - 斩秋rocketmq 源码过程中的笔记中整理出来的,由于时间及能力原因,理 解有误之处还请谅解,希望对大家学习使用 rocketmq 有所帮助。 Rocketmq 是阿里基于开源思想做的一款产品,代码托管于 github 上,要想学好用好 rocketmq 请从 https://github.com/alibaba/RocketMQ 获取最权威的文档、问题解答、原理介 绍等。 offset 查找到 commitLog 中 的 prepared 消息,设置消息状态 commitType 或者 rollbackType , 让后将信息添加到 commitLog 中, 其实二阶段生成了两条消息 事物消息发送 三:Broker 落地消息 2.1 普通消息落地 tranStateTable 文件重建事物状态表 异常恢复: 先按照正常流程恢复 Tran Redo Log commitLog 异常恢复,commitLog 根据 checkpoint 时间点重新生成 redolog, 重新分发 消息 DispatchRequest, 分发消息到位置信息到 ConsumeQueue 更新 Transaction State Table0 码力 | 57 页 | 2.39 MB | 1 年前3
GPU Resource Management On JDOS实验 JDOS 常规的容器服务 ,使用 gpu 的 zone , 自行设定相应的镜像即 可,有完善的周边服务 训练服务 • 提供基于 kubeflow 的分布式训练方案 – 界面化操作,用户提供代码地址和执行命令即可 – 系统内建支持安装 pip 依赖 – 自制存储插件支持分布式文件系统存储用户数据 – 支持官方镜像,不需要 JDOS 提前协助制作镜像 – 提供 tensorboard GPU 利用率 – Job 调度 (部门 quota 限制 + 优先级) • 创建训练 – 用户选择集群提供代码地址和执行命令即可 – 选择所用框架(镜像):支持官方,亦可自制 (提供 dockerfile 生成镜像服务) – 选择存储来源:对接了内部的存储 – 填写代码地址,执行的命令等 – 可以选择是否监控训练,提供 tensorboard 任务列表 可以指定 git 的 commit-id0 码力 | 11 页 | 13.40 MB | 1 年前3
Ubuntu 桌面培训 2010com) 版权 © 2010 JimHu (jimhuyiwei@gmail.com) 欢迎访问本课程网站:http://people.ubuntu.com/˜happyaron/udc-cn 生成时间:20100725T1630 版本:Daily 本课程由 Canonical 有限公司和 Ubuntu 培训社区创作 2008-2010。 这个协议受到知识共享署名-非商业性使用-相同方式共享的约束 品设计和生产技术发展。它既是理论,也是具体的实践。开源的广泛实践使得软件用 户可以获得他们所使用软件的源代码,并且知识产权限制很少甚至没有,这允许用户 对软件进行修改,或者利用获得的代码编写并发布新的软件,使其满足自身需要,或 者进行互相协作以改进开源软件。开源和 Linux 都是在逐步变化的过程中,形成今天 的样子的。 自由分发的源代码的想法是为了鼓励人们自愿地、相互协同地开发软件。用户不断参 与增强软件、修复缺陷、开发新功能并且和其他人分享。 的商业模式 都是以硬件为中心,软件只是被看作使硬件工作的东西。他们提供软件的同时也提供 源代码,软件可以被修改并因此得到改进,这便是现在开源软件的早期情况。但是, 随着硬件价格的不断下跌,销售硬件的利润也逐渐减小,制造商开始期望软件能够带 来额外的收入。越来越多的厂商开始单独销售软件,也不再提供软件的源代码。 1983年春天,Richard Matthew Stallman,这位曾经在 MIT 人工智能实验室工作0 码力 | 540 页 | 26.26 MB | 1 年前3
RocketMQ v3.2.4 开发指南com/alibaba/RocketMQ 28 */ consumer.subscribe("TopicTest1", "TagA || TagC || TagD"); 如以上代码所示,简单消息过滤通过挃定多个 Tag 来过滤消息,过滤劢作在服务器迕行。实现原理参照第 7.4 节 8.2 高级消息过滤 Broker Filter Server Filter Server 难以全面利用高配的物理机 Cpu 资源 4. 因为过滤代码使用 Java 诧言来编写,应用几乎可以做任意形式的服务器端消息过滤,例如通过 Message Header 迕行过滤,甚至可以挄照 Message Body 迕行过滤。 5. 使用 Java 诧言迕行作为过滤表达式是一个双刃剑,方便了应用的过滤操作,但是带来了服务器端的安全风险。 需要应用来保证过滤代码安全,例如在过滤程序里尽可能丌做申请大内存,创建线程等操作。避免 整数 请求操作代码,请求接收方 根据丌同的代码做丌同的操 作 应答结果代码,0 表示成 功,非 0 表示各种错诨 代码 language 字符串 请求収起方实现诧言,默讣 JAVA 应答接收方实现诧言 version 整数 请求収起方程序版本 应答接收方程序版本 opaque 整数 请求収起方在同一连接上丌 同的请求标识代码,多线程 连接复用使用0 码力 | 52 页 | 1.61 MB | 1 年前3
强大的音视频处理工具: FFmpegGitbook最后更新: 2021-09-13 16:20:32 获取 34 字幕分类 根据字幕信息嵌⼊到视频中的⽅式,可以把字幕分为: 软字幕 特点 过程可逆 可以提取出字幕⽂件,查看字幕源代码 包含 内挂字幕 ⼀般指字幕⽂件与视频⼀同封装在MKV⽂件中,播放时 需经过播放器处理解析显示(=VSFilter渲染) 外挂字幕 以单独的字幕⽂件形式存在,播放时经播放器处理解析 显示(=VSFilter渲染)到视频上 在SSA编写⻛格的基础上增添更多的效果和指令 使⽤现状 该字幕格式常被字幕组所应⽤ ⽬前有很多播放器⽀持渲染SSA、ASS字幕 最新版本:V4.00+ ASS字幕分类 软字幕 特点 过程可逆 可以提取、取出和查看源代码的 包含 内挂字幕 ⼀般指字幕⽂件与视频⼀同封装在MKV⽂件 中,播放时需经过VSFilter渲染 外挂字幕 字幕⽂件以单独形式存在,播放时经VSFilter 渲染到视频上 内嵌字幕 detectVideoDimension :获取视频属性 需要的,可以直接拿去⽤。 ⽤Python调⽤ffmpeg ⽤python代码调⽤ffmpeg去从mp4中(根据字幕 信息)截图mp3⾳频⽚段 ⼼得:加 -nostdin 避免后台模式运⾏时卡 死 Python代码中调⽤ffmpeg去处理视频,⽐如: 然后正常运⾏Python时: python3 processCourseVideo.py0 码力 | 73 页 | 11.57 MB | 1 年前3
基于go和flutter的实时通信/视频直播解决方案 段维伟基于 Skia 2D 渲染引擎 • 使用类似JS/TS的Dart 语言开发 • 支持代码编辑后热重载, Flutter 支持那些平台 iOS/Android/Web/Windows/Linux/macOS/Embedded 使用flutter 开发app意味着什么? • 无需为每个平台独立维护代码 • 一次编码,多平台运行,效率最大化 • 多平台一致性体验 • 强大的社区资源 Flutter-WebRTC Orlando Co https://github.com/OrlandoCo • CloudWebRTC https://github.com/cloudwebrtc pion 和 ion 社区的所有代码均为MIT授权, 相关github 地址如下: https://github.com/pion/ion https://github.com/flutter-webrtc https://github0 码力 | 38 页 | 2.22 MB | 1 年前3
共 13 条
- 1
- 2













