 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单(如医疗、法律)进行优化, 提供高精度结果。  长文本处理:擅长处理长文本 和复杂文档,适合专业场景。  定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini  小型化设计:轻量级模型, 适合资源有限的环境。  快速响应:优化推理速度, 适合实时交互场景。  通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 年春运(2025年1月14日到2月8日) 相关数据(如日期、全社会跨区域人员流动量、铁路客运 量、公路人员流动量、水路客运量、民航客运量等)”完 成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 目前DeepSeek R1、Open AI o3mini、Kimi k1.5支持联网查询网址,Claude 3.5 sonnet暂不支持;  四个模型均能根据上传的网页代码,对多个网址链接进行筛选、去重,完全提取出符合指令要求的所有网址链接并形成列表;  在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完0 码力 | 85 页 | 8.31 MB | 8 月前3 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单(如医疗、法律)进行优化, 提供高精度结果。  长文本处理:擅长处理长文本 和复杂文档,适合专业场景。  定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini  小型化设计:轻量级模型, 适合资源有限的环境。  快速响应:优化推理速度, 适合实时交互场景。  通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 年春运(2025年1月14日到2月8日) 相关数据(如日期、全社会跨区域人员流动量、铁路客运 量、公路人员流动量、水路客运量、民航客运量等)”完 成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 目前DeepSeek R1、Open AI o3mini、Kimi k1.5支持联网查询网址,Claude 3.5 sonnet暂不支持;  四个模型均能根据上传的网页代码,对多个网址链接进行筛选、去重,完全提取出符合指令要求的所有网址链接并形成列表;  在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完0 码力 | 85 页 | 8.31 MB | 8 月前3
 DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modelamong open-source models. The model checkpoints are available at h t t p s : / / g i t h u b . c o m / d e e p s e e k - a i / D e e p S e e k - V 2 . 0 20 40 60 80 100 Activated Parameters (Billions) 55 2; ...; k?,?ℎ] = k?, (5) [v?,1;v?,2; ...; v?,?ℎ] = v?, (6) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √ ?ℎ )v?,?, (7) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (8) where q?,?, k?,?, v?,? ∈ R?ℎ denote the query, key [q? ?,?; q? ?,?], (16) k?,? = [k? ?,?; k? ? ], (17) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √︃ ?ℎ + ?? ℎ )v? ?,?, (18) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (19) where ??? ∈ R?? ℎ ?ℎ×?′ ? and ? ?? ∈ R??0 码力 | 52 页 | 1.23 MB | 1 年前3 DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modelamong open-source models. The model checkpoints are available at h t t p s : / / g i t h u b . c o m / d e e p s e e k - a i / D e e p S e e k - V 2 . 0 20 40 60 80 100 Activated Parameters (Billions) 55 2; ...; k?,?ℎ] = k?, (5) [v?,1;v?,2; ...; v?,?ℎ] = v?, (6) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √ ?ℎ )v?,?, (7) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (8) where q?,?, k?,?, v?,? ∈ R?ℎ denote the query, key [q? ?,?; q? ?,?], (16) k?,? = [k? ?,?; k? ? ], (17) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √︃ ?ℎ + ?? ℎ )v? ?,?, (18) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (19) where ??? ∈ R?? ℎ ?ℎ×?′ ? and ? ?? ∈ R??0 码力 | 52 页 | 1.23 MB | 1 年前3
 Trends Artificial Intelligence
Cloud GPUs Computing Cycles Over Time – 1960s-2020s, per Morgan Stanley Note: Axis is logarithmic; i.e., there are expected to be tens of thousands more AI Era devices than Mainframe devices 1960 Department of Homeland Security unveils its AI Roadmap Strategy 5/24: OpenAI releases GPT-4o, which has full multimodality across audio, visual, & text inputs 7/24: Apple releases Apple 12/24: OpenAI announces o3, its highest-ever performing model 1/25: Alibaba unveils Qwen2.5-Max, which surpasses the performance of other leading models (GPT- 4o, Claude 3.5) on some0 码力 | 340 页 | 12.14 MB | 4 月前3 Trends Artificial Intelligence
Cloud GPUs Computing Cycles Over Time – 1960s-2020s, per Morgan Stanley Note: Axis is logarithmic; i.e., there are expected to be tens of thousands more AI Era devices than Mainframe devices 1960 Department of Homeland Security unveils its AI Roadmap Strategy 5/24: OpenAI releases GPT-4o, which has full multimodality across audio, visual, & text inputs 7/24: Apple releases Apple 12/24: OpenAI announces o3, its highest-ever performing model 1/25: Alibaba unveils Qwen2.5-Max, which surpasses the performance of other leading models (GPT- 4o, Claude 3.5) on some0 码力 | 340 页 | 12.14 MB | 4 月前3
 Manus AI:Agent元年开启/012334%&'(56789:;<=>?@A BC%&'() • DEFGHI)*DEFGJKHI567LMN0OITPQRSTUVW5VWXYZ=>O[ \]^_`) • abcde&fghi=>.gjklmno5pqLr?E=PstOuv5w%xyabz {|L}=>~}m•O2€.jk• • ‚ƒc„…†Agent…‡ˆAGIO‰Š‹Œ•1 Manus AI!"#$%&'Agent3 Manus AI%&'() "GAIçèûÞ&> • AI*+uv5´µ#$GManusuv,!"#$%AI*+,)`%&R<º»JK> • ÑÒÓ*5'de() • ManusêëF-*Bz'()+,-,Manus./I6¦Gdeáâ(),012÷345de> !"#$%Bloomberg*&'()7 Manus AI%6789: • 67,89:;<щ=>?Š@&ACEO,BC‡DF<Ñg[> • 2016 ƒ5†D‡[ˆ%GD‡5†IJÞ--‰Š!ƒD‡5†[ˆGfigma> • 2022Eb,÷‹MonicauŒ>Monica!"#¶‰$•)€GAIŸ ,$ŒÜÝÞLMŽ•áâS),•ÌQŸ%ãR²cA+C•‘W O>Monica !"#. ChatGPT API áâ()G Chrome ßà,’L Manus AI:Agent元年开启/012334%&'(56789:;<=>?@A BC%&'() • DEFGHI)*DEFGJKHI567LMN0OITPQRSTUVW5VWXYZ=>O[ \]^_`) • abcde&fghi=>.gjklmno5pqLr?E=PstOuv5w%xyabz {|L}=>~}m•O2€.jk• • ‚ƒc„…†Agent…‡ˆAGIO‰Š‹Œ•1 Manus AI!"#$%&'Agent3 Manus AI%&'() "GAIçèûÞ&> • AI*+uv5´µ#$GManusuv,!"#$%AI*+,)`%&R<º»JK> • ÑÒÓ*5'de() • ManusêëF-*Bz'()+,-,Manus./I6¦Gdeáâ(),012÷345de> !"#$%Bloomberg*&'()7 Manus AI%6789: • 67,89:;<щ=>?Š@&ACEO,BC‡DF<Ñg[> • 2016 ƒ5†D‡[ˆ%GD‡5†IJÞ--‰Š!ƒD‡5†[ˆGfigma> • 2022Eb,÷‹MonicauŒ>Monica!"#¶‰$•)€GAIŸ ,$ŒÜÝÞLMŽ•áâS),•ÌQŸ%ãR²cA+C•‘W O>Monica !"#. ChatGPT API áâ()G Chrome ßà,’L- !"#$%Bloomberg*&'()2 Agent()9 Agent%;<=4 0 码力 | 23 页 | 4.87 MB | 5 月前3
 清华大学 普通人如何抓住DeepSeek红利! 学习太难?DeepSeek带你“开挂”逆袭! 生活太累?DeepSeek帮你“减负”到家! 社交障碍?DeepSeek教你“高情商”破局! ZXDWsPoPvNtNtNnQnPpMsP8O8QaQpNpPsQqNeRqQnPkPnMpM9PoOwOxNpNsPuOqQpN p 提示词驱动的新生产力 在AI时代,知识的获取成本趋近于零,拥有知识不再是核心竞争力。利用提示词创造知识,引领创新、明确 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。 (Pass@1) S v L C q Y 4 Y V 1 T 8 0 u m B k k m O x d k C i y K r j i 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、0 码力 | 65 页 | 4.47 MB | 8 月前3 清华大学 普通人如何抓住DeepSeek红利! 学习太难?DeepSeek带你“开挂”逆袭! 生活太累?DeepSeek帮你“减负”到家! 社交障碍?DeepSeek教你“高情商”破局! ZXDWsPoPvNtNtNnQnPpMsP8O8QaQpNpPsQqNeRqQnPkPnMpM9PoOwOxNpNsPuOqQpN p 提示词驱动的新生产力 在AI时代,知识的获取成本趋近于零,拥有知识不再是核心竞争力。利用提示词创造知识,引领创新、明确 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。 (Pass@1) S v L C q Y 4 Y V 1 T 8 0 u m B k k m O x d k C i y K r j i 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、0 码力 | 65 页 | 4.47 MB | 8 月前3
 OpenAI 《A practical guide to building agents》piece of info is missing. 11 A practical guide to building agents You can use advanced models, like o1 or o3-mini, to automatically generate instructions from existing documents. Here’s a sample prompt illustrating initiate_ refund function ‘is_safe’ True Reply to user User input User AgentSDK gpt-4o-mini Hallucination/ relevence gpt-4o-mini (FT) safe/unsafe LLM Moderation API Rules-based protections input character ( ) except GuardrailTripwireTriggered: ( ) try: await print print "I think I might cancel my subscription") "Guardrail didn't trip - this is unexpected" "Churn detection guardrail0 码力 | 34 页 | 7.00 MB | 6 月前3 OpenAI 《A practical guide to building agents》piece of info is missing. 11 A practical guide to building agents You can use advanced models, like o1 or o3-mini, to automatically generate instructions from existing documents. Here’s a sample prompt illustrating initiate_ refund function ‘is_safe’ True Reply to user User input User AgentSDK gpt-4o-mini Hallucination/ relevence gpt-4o-mini (FT) safe/unsafe LLM Moderation API Rules-based protections input character ( ) except GuardrailTripwireTriggered: ( ) try: await print print "I think I might cancel my subscription") "Guardrail didn't trip - this is unexpected" "Churn detection guardrail0 码力 | 34 页 | 7.00 MB | 6 月前3
 DeepSeek从入门到精通(20250204)如何使用DeepSeek? https://chat.deepseek.com 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 Refinement, Synthesis)。这个 模型概括了提示语链设计的四个关键环节: R e f i n e m e n t ( 优 化 ) C o n t e x t ( 上 下 文 ) 对初步输出进行修改和完善 Synthesis(综合) 整合所有输出,形成最终成果 I n s t r u c t i o n ( 指 令 ) 给出具体的指示 提供背景信息和任务概述 任务分解的提示语链设计步骤0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)如何使用DeepSeek? https://chat.deepseek.com 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 Refinement, Synthesis)。这个 模型概括了提示语链设计的四个关键环节: R e f i n e m e n t ( 优 化 ) C o n t e x t ( 上 下 文 ) 对初步输出进行修改和完善 Synthesis(综合) 整合所有输出,形成最终成果 I n s t r u c t i o n ( 指 令 ) 给出具体的指示 提供背景信息和任务概述 任务分解的提示语链设计步骤0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 Refinement, Synthesis)。这个 模型概括了提示语链设计的四个关键环节: R e f i n e m e n t ( 优 化 ) C o n t e x t ( 上 下 文 ) 对初步输出进行修改和完善 Synthesis(综合) 整合所有输出,形成最终成果 I n s t r u c t i o n ( 指 令 ) 给出具体的指示 提供背景信息和任务概述 任务分解的提示语链设计步骤0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 Refinement, Synthesis)。这个 模型概括了提示语链设计的四个关键环节: R e f i n e m e n t ( 优 化 ) C o n t e x t ( 上 下 文 ) 对初步输出进行修改和完善 Synthesis(综合) 整合所有输出,形成最终成果 I n s t r u c t i o n ( 指 令 ) 给出具体的指示 提供背景信息和任务概述 任务分解的提示语链设计步骤0 码力 | 103 页 | 5.40 MB | 8 月前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502预训练范式像是记忆和模仿,强化学习范 式更像探索实践  记住很多东西只是基础,真正有价值的是 融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种政企、创业者必读 快思考 慢思考 快 慢 人类真正智力表现 的形式 直觉经验型 速度快、准确性低 GPT、DeepSeek-V3擅长的 思考方式 推理能力获得突破的关键是学会了「慢思考」 自己跟自己对弈 ChatGPT时刻 • OpenAI ChatGPT大模型, 通过预训练方式,实现涌 现,理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习,但训练复 杂推理能力,技术未公开 • DeepSeek-R1 探索出RL方 法,且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、 大数据分析、 工作流知识)0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502预训练范式像是记忆和模仿,强化学习范 式更像探索实践  记住很多东西只是基础,真正有价值的是 融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种政企、创业者必读 快思考 慢思考 快 慢 人类真正智力表现 的形式 直觉经验型 速度快、准确性低 GPT、DeepSeek-V3擅长的 思考方式 推理能力获得突破的关键是学会了「慢思考」 自己跟自己对弈 ChatGPT时刻 • OpenAI ChatGPT大模型, 通过预训练方式,实现涌 现,理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习,但训练复 杂推理能力,技术未公开 • DeepSeek-R1 探索出RL方 法,且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、 大数据分析、 工作流知识)0 码力 | 76 页 | 5.02 MB | 5 月前3
 TVM@Alibaba AI LabsResolution Quantization Orize Kernel ALIOS TVM Alibaba Al.Labs 阿里巴巴人工智能实验室 7= 590一I) rm 一 下Er (mm) =肪+2mxaM0 [5 (全-2)+o| current plan 1 = int16 * int16 erflow-aware int16 = int8 xint8 ent pl 1=int80 码力 | 12 页 | 1.94 MB | 5 月前3 TVM@Alibaba AI LabsResolution Quantization Orize Kernel ALIOS TVM Alibaba Al.Labs 阿里巴巴人工智能实验室 7= 590一I) rm 一 下Er (mm) =肪+2mxaM0 [5 (全-2)+o| current plan 1 = int16 * int16 erflow-aware int16 = int8 xint8 ent pl 1=int80 码力 | 12 页 | 1.94 MB | 5 月前3
共 27 条
- 1
- 2
- 3














