DeepSeek图解10页PDFLearning, RL) . . . . . . . 7 3 DeepSeek-R1 精华图解 . . . . . . . . . . . . . . . . . . . . . . . 7 3.1 DeepSeek-R1 完整训练过程 . . . . . . . . . . . . . . . . . . . 7 3.1.1 核心创新 1:含 R1-Zero 的中间推理模型 . . . . • 步骤 1:人类标注者提供高质量回答。 • 步骤 2:模型学习人类评分标准,提高输出质量。 • 步骤 3:强化训练,使得生成的文本更符合人类偏好。 3 DeepSeek-R1 精华图解 3.1 DeepSeek-R1 完整训练过程 DeepSeek-R1 主要亮点在于出色的数学和逻辑推理能力,区别于一般的通 用 AI 模型。其训练方式结合了强化学习(RL)与监督微调(SFT),创造0 码力 | 11 页 | 2.64 MB | 8 月前3
普通人学AI指南. 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1:安装 Ollama . . . 8B,70B 两种参数,分 为基础预训练和指令微调两种模型。 与 Llama2 相比,Llama3 使用了 15T tokens 的训练数据,在推理、数学、 代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1:安装 Ollama Ollama 可以简单理解为客户端,实现和大模型的交互。ollama 软件 win 和 mac 都包括,如图 11 所示。 130 码力 | 42 页 | 8.39 MB | 8 月前3
人工智能安全治理框架 1.0安全治理框架1. 人工智能安全治理原则 …………………………………… 1 2. 人工智能安全治理框架构成 ……………………………… 2 3. 人工智能安全风险分类 …………………………………… 3 3.1 人工智能内生安全风险 ……………………………… 3 3.2 人工智能应用安全风险 ……………………………… 5 4. 技术应对措施 ……………………………………………… 7 4.1 针对人工智能内生安全风险 人工智能安全风险分类 人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期 各环节都面临安全风险,既面临自身技术缺陷、不足带来的风险,也面临不当 使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险 (a)可解释性差的风险。以深度学习为代表的人工智能算法内部运行逻 辑复杂,推理过程属黑灰盒模式,可能导致输出结果难以预测和确切归因,如 有异常难以快速修正和溯源追责。0 码力 | 20 页 | 3.79 MB | 1 月前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language ModelToken-Dropping Strategy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 Pre-Training 11 3.1 Experimental Setups . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.1 efficiency requirements, and always ensure consistency between training and inference. 3. Pre-Training 3.1. Experimental Setups 3.1.1. Data Construction While maintaining the same data processing stages as0 码力 | 52 页 | 1.23 MB | 1 年前3
Trends Artificial Intelligence
models for each company that are measured: for OpenAI, o1; for Alibaba, Qwen 2.5 72B; for Meta, Llama 3.1 405B; for Anthropic, Claude 3.5 Sonnet. The tests used are HumanEval, MATH-500, MMLU and GPQA Diamond informational restrictions. Source: Sensor Tower (5/6/25) Country % of Global Users (4/25) 33.9% 2.7% 3.1% 3.5% 4.4% 6.9% 9.2% DeepSeek Mobile App Monthly Active Users (MAUs) (MM) – 1/25-4/25, per Sensor0 码力 | 340 页 | 12.14 MB | 5 月前3
清华大学 普通人如何抓住DeepSeek红利数据嫁接:若缺乏具体数据,直接让AI生成合理虚构值(标注“示例”规避风险): p “假设园区占地500亩,日均处理包裹量50万件,请计算自动化分拣设备的配置数量,用表格展示。” p 模板复制:对同类章节(如3.1/3.2/3.3)使用相同指令模板,仅替换关键词。 p 强制格式:要求AI输出带编号小标题、分点、表格的内容,直接粘贴后即显“专业感”。 第三阶段:20分钟——用AI补全软性内容(目标:1000字)0 码力 | 65 页 | 4.47 MB | 8 月前3
共 6 条
- 1













