清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人次”的网址进行去重、筛选,合并成网址列表 2.撰写python脚本,基于步骤1输出的网址列表提取所有网 址内容“截至目前 2025 年春运(2025年1月14日到2月8日) 相关数据(如日期、全社会跨区域人员流动量、铁路客运 量、公路人员流动量、水路客运量、民航客运量等)”完 成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 运行后完成数据爬虫任务,0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测 多源信息融合 知识与推理 知识图谱构建 流程优化 数据可视化 数据分析 趋势分析 DeepSeek的深度思考过程独树一帜 《香料三重奏》茄椒肠卷配酸奶薄荷酱 ??? 灵感地图:巴尔干半岛香料 × 地中海清新感 × 日式天妇罗手 法 ??? 结构解构: 1.青椒薄片 - 采用日式天妇罗手法炸至半透明,形成琥珀色脆网 2.茄泥慕斯 - 融入保加利亚红椒粉与希腊酸奶,制成空气感慕斯 3.香肠脆粒 - 伊比利亚辣肠低温烘烤后粉碎成黄金脆粒 4.薄荷冷萃油 - 液态氮急冻薄荷叶萃取的翡翠色精油 ???️ 味觉风暴: •第1层:青椒脆片释放灯笼椒特有的清甜 第四阶段:10分钟——用AI优化与格式伪装 p统一话术: “将以下段落改写成政府报告风格,加入‘数字化转型’‘双碳战略’等关键词:{粘贴原文}” p生成图表: 指令:“将上文‘设备配置表’转换成LaTeX格式的三线表。”插入图表后,自动增加方案“厚度”。 p最终润色: “检查以下方案书逻辑漏洞,列出3个可能被客户质疑的点,并给出应对答案。” p关键提醒: ü 保命优先级:先堆字数再优化,前0 码力 | 65 页 | 4.47 MB | 8 月前3
普通人学AI指南于编码方式。 上下文窗口大小决定了模型在回答问题或生成文本时可以利用的上下文范 围。窗口越大,模型就能处理越长的上下文,对理解长文本内容非常重要。 较大的窗口允许模型处理更长的文本片段,从而提高在长文本任务中的表 现,如长篇对话、文档生成和分析等。 1.4.2 单位 B 和 T 在 AI 大模型中,常用的两个单位是 B 和 T。 B(十亿,Billion):在英文里是 Billion 的缩写,表示十亿。对于 ollama,安装步骤非常简 单。 3.1.2 步骤 2:安装 Llama 下载 Llama3,打开新的终端/命令行窗口,执行以下命令: ollama run llama3 程序会自动下载 Llama3 的模型文件,默认是 8B,也就 80 亿参数版本,个 人电脑完全可以运行。等待安装完成,如图 12 所示。 14 Figure 12: Ollama 里下载 Llama3 界面 以上就已经安装完毕,到现在大模型已经在本地部署完成。 包含了运行所需的代 码、运行时、系统工具、系统库和设置。 2. 镜像(Image):用于创建容器的只读模板。一个镜像可以包含完整的操作 系统环境。 3. Dockerfile:定义镜像内容的文本文件,包含了构建镜像的所有指令。 4. Docker Hub:公共的 Docker 镜像仓库,用于存储和分发 Docker 镜像。 5. 拉取镜像:docker pull0 码力 | 42 页 | 8.39 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代,人工智能产业呈现出创新技术群体突 破、行业应用融合发展、国际合作深度协同等新特点,亟需 完善人工智能产业标准体系。 二、总体要求 以习近平新时代中国特色社会主义思想为指导,全面贯 包括软硬件编译器架构和优化方法、人工智能算子库、芯片软件 运行时库及调试工具、人工智能软硬件平台计算性能等标准。 7. 开发框架标准。规范人工智能开发框架相关的技术要求, 包括开发框架的功能要求,与应用系统之间的接口协议、神经网 络模型表达和压缩等标准。 8. 软硬件协同标准。规范智能芯片、计算设备等硬件与系 统软件、开发框架等软件之间的适配要求,包括智能芯片与开发 框架的适配要求、人工智能计算任务调度、分布式计算等软硬件0 码力 | 13 页 | 701.84 KB | 1 年前3
DeepSeek从入门到精通(20250204)且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 输入。 表1-1-1提示语的本质特征 特征 描述 示例 沟通桥梁 连接人类意图和AI理解 “将以下内容翻译为法语:Hello, world” 上下文提供 者 为AI提供必要的背景信息 “假设你是一位19世纪的历史学家 AI能力引导 器 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 提示语的类型 掌握提示语设计:AIGC时代的必备技能 提示语设计的核心技能体系 表1-3-1提示语设计核心技能子项 核心技能 子项 问题重构能力 将复杂、模糊的人类需求转化为结构化的AI任务 识别问题的核心要素和约束条件 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 特定场景。 4. 创意型提示语:引导AI进行创意写作或内容生成。 5. 分析型提示语:要求AI对给定信息进行分析和推 理。 6. 多模态提示语:结合文本、图像等多种形式的 输入。 表1-1-1提示语的本质特征 特征 描述 示例 沟通桥梁 连接人类意图和AI理解 “将以下内容翻译为法语:Hello, world” 上下文提供 者 为AI提供必要的背景信息 “假设你是一位19世纪的历史学家 AI能力引导 器 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 提示语的类型 掌握提示语设计:AIGC时代的必备技能 提示语设计的核心技能体系 表1-3-1提示语设计核心技能子项 核心技能 子项 问题重构能力 将复杂、模糊的人类需求转化为结构化的AI任务 识别问题的核心要素和约束条件 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语0 码力 | 103 页 | 5.40 MB | 8 月前3
人工智能安全治理框架 1.0能发展、安全与治理重大问题。推进 APEC、G20、金砖国家等多边机制下的 人工智能安全治理合作,加强与共建“一带一路”国家、“全球南方”国家合作, 研究成立人工智能安全治理联盟,增强发展中国家在全球人工智能治理中的代 表性和发言权。鼓励人工智能企业、机构开展跨国交流合作,分享最佳操作实 践,共同制定人工智能安全国际标准。 6. 人工智能安全开发应用指引 6.1 模型算法研发者安全开发指引 (a)研发者应在需求 知人工智能产品和服务的适用范围、注意事项、使用禁忌,支持使用者知情选 择、审慎使用。 (c)服务提供者应在告知同意、服务协议等文件中,支持使用者行使人 类监督和控制责任。 (d)服务提供者应让使用者了解人工智能产品的精确度,在人工智能决 策有重大影响时,做好解释说明预案。 (e)服务提供者应检查研发者提供的责任说明文件,确保责任链条可以 追溯到递归采用的人工智能模型。 (f)服务提供者应提高人工智能风险防范意识,建立健全实时风险监控0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学第二弹:DeepSeek赋能职场金牌 金山办公2024中文文本智能校对大赛 第二名 2024 法研杯 法律要素争议焦点识别 第二名 AFAC2024金融智能创新大赛 金融工具学习 三等奖 Googl e kaggl e全球专利文件短语相似性匹配 金牌 Googl e kaggl e全球自动问答比赛 金牌 Googl e kaggl e全球医疗对话理解 金牌 2021全球人工智能技术创新大赛-小布助手对话短文本语义匹配 一等奖 根据用户提供的主题、内容要求、风格偏好,自动生成专业详实的PPT大纲(markdown),并针 对核心内容设计流程图(mermaid)。 技能: •资料收集能力:能够快速收集和分析相关主题的最新数据和报告,形成表 格,提取关键信息并转化为易于理解的PPT大纲。 •内容结构化:根据用户的需求,提供清晰、条理化的PPT结构,确保内容 流畅且富有逻辑。 •领域特定知识:掌握不同领域的特有知识,包括行业术语、法规、技术发0 码力 | 35 页 | 9.78 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502服务器和算力投入安全行业第一 • 创新能力第一,专利申请1.5万件,安全行业最多 • 服务和响应能力第一 • 用户数量第一,覆盖225个国家和地区的15亿终端 • 企业客户规模第一的网安公司 • A股网安公司市值第一 安全能力最强,八个中国第一 中国的360 世界领先、中国第一的网络安全领军企业 中国唯一被美双重制裁的互联网企业和安全企业 75政企、创业者必读 探索形成了一套自主0 码力 | 76 页 | 5.02 MB | 6 月前3
开源中国 2023 大模型(LLM)技术报告(图源:https://openai.com/research/ai-and-compute) 31 / 32 oschina.net gitee.com 公众号 视频号 关注我们,开源开发者圈一网打尽 32 / 320 码力 | 32 页 | 13.09 MB | 1 年前3
共 12 条
- 1
- 2













