清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单3 年 1 1 月 2 9 日 推出670亿参数的通用大模型 D e e p S e e k L L M , 包 括 7 B 和67B的base及chat版本 发 布 新 一 代 推 理 模 型 D e e p S e e k - R 1 , 性 能 与 O p e n A I 的 o 1 正 式 版 持平,并开源 2 0 2 5 年 1 月 2 0 日 2 0 2 4 年 1 推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模 型综合技能以外,还重点提升了模型在数学、代码、逻辑推理等硬核 任务上的能力。 推理过程 DeepSeek R1 在推理过程中采用“深度思考”模式,通过展示完整的 推理路径来提高模型的可解释性和可信度。 在生成答案前展示其推理过 程,让用户看到模型如何分 解问题并得出结论。包括模 型对问题的理解、问题分解、 以及逐步求解的过程。 决了纯强化学习训练中可能出现的可读性差和语言混杂等问题。 第一阶段:推理 导向的强化学习 基 于 冷 启 动 数 据 微 调 后 的 基 础 模 型 , 进 行 大 规 模 强 化 学 习 。 此 阶 段 引 入 语 言 一 致 性 奖 励 , 优 化 模 型 在 数 学 、 编 程 等 结 构 化 任 务 中 的表现。 第二阶段:拒绝 采样与监督微调 通 过 拒 绝 采 样 从 R0 码力 | 85 页 | 8.31 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告频多种介质,在文本生成、图片生成、AI 编程等方向均 有出色的表现。 GitHub Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 机构的大模型产品首批通过《生成式人工智能 服务管理暂行办法》备案,可正式上线面向公 众提供服务。 具体包括:百度(文心一言)、抖音(云雀大 模型)、智谱 AI(GLM 大模型)、中科院 (紫东太初大模型)、百川智能(百川大模 型)、商汤(日日新大模型)、MiniMax (ABAB 大模型)、上海人工智能实验室(书 生通用大模型)、腾讯(混元大模型,9月15 日通过)。 18 / 32 大模型应用现状:知名大模型应用 是一种基于 LLM 的智能代理,它能够自主学习和执行任务, 具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着 LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模 式。 LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行 任务,从而提高了 LLM 的应用范围和价值;它为 LLM 的智能化发展提 供了新的方向,使 LLM 能够更加接近于人类智能。0 码力 | 32 页 | 13.09 MB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的 预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后,继续增大参数规 模难以带来质的提升 • 训练算力成本和工程化难度大幅上升 强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习,在不增大参 数规模前提下,大幅提升复杂推理能力 33政企、创业者必读 新时代下的集中力量办大事 每个企业都可以直接使用DeepSeek,因为开源透明可信任,企业和 政府可做大量私有化部署 一个开源产品获得突破之后,全世界都能分享成果,结束中国百模大 战,节省大量成本 很多公司参与开源,帮助改进产品,很多人基于DS生态开发应用产 品,增加影响力,人人为我,我为人人 技术开放,对人工智能行业形成蓬勃发展,寒武纪大爆炸,推动AGI 从数年缩短到几分钟,解开了生物学密码 成功预测了地球存在的2亿种蛋白质结构 45政企、创业者必读 DeepSeek典型的四大安全问题:客户端安全、Agent安全、知识安全、模型安全 360提出「以模制模」新解法,应对DeepSeek安全问题 DeepSeek六大应用方向之六 AI安全:实现安全的「自动驾驶」 46政企、创业者必读 大模型的六大能力 47 基本 能力 业务 能力 创新0 码力 | 76 页 | 5.02 MB | 5 月前3
DeepSeek图解10页PDF1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 ented Reinforcement Learn- ing)得到中间推理模型(Iterim reasoning model), 图8会详细解释中间模 型的训练过程。 DeepSeek-R1 核心贡献:首次验证了通过纯强化学习也能大幅提升大模 型推理能力,开源纯强化学习推理模型 DeepSeek-R1-Zero R1-Zero 能生成高质量的推理数据,包括大量长链式思维(Chain-of-Thought0 码力 | 11 页 | 2.64 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)口协议、性能评定、试验方法等技术要求,包括智能传感器的架 构、指令、数据格式、信息提取方法、信息融合方法、功能集成 方法、性能指标和评价方法等标准。 4. 计算设备标准。规范人工智能加速卡、人工智能加速模 组、人工智能服务器等计算设备,及使能软件的技术要求和测试 方法,包括人工智能计算设备虚拟化方法,人工智能加速模组接 口协议和测试方法,及使能软件的访问协议、功能、性能、能效 的测试方法和运行维护要求等标准。 群体智能标准。规范群体智能算法的控制、编队、感知、 规划、决策、通信等技术要求和评测方法,包括自主控制、协同 控制、任务规划、路径规划、协同决策、组网通信等标准。 11. 跨媒体智能标准。规范文本、图像、视频、音频等多模 态数据处理基础、转换分析、融合应用等方面的技术要求,包括 数据获取与处理、模态转换、模态对齐、融合与协同、应用扩展 等标准。 12. 具身智能标准。规范多模态主动与交互、自主行为学习、 仿0 码力 | 13 页 | 701.84 KB | 1 年前3
普通人学AI指南界面简洁但因表情符出现又不失枯燥 4 零代码搭建本地 AI 前端 到目前,我们使用大模型的界面还是一个终端窗口,黑乎乎的,交互不友好。 这章教你搭建一个美观炫酷的前端网页,如图 20所示,让你使用本地大模 型,更方便!更舒心!关键搭建简单,顺利的话,三五分钟搞定。后面完全免费 畅享使用大模型! Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 名为 lobe-chat 的 Docker 容器,并设置一些特定参数: docker run : 启 动 并 运 行 一 个 新 的 Docker 容 器。 -d: 在 后 台 (守 护 进 程 模 式) 运 行 容 器, 不 会 占 用 当 前 终 端。 --name lobe-chat : 给 容 器 分 配 一 个 名 称 lobe-chat 。 这 有 助 于 以 后 通 过 名 称 管0 码力 | 42 页 | 8.39 MB | 8 月前3
Deepseek R1 本地部署完全手册32GB(M3 Max) - 存储: 20GB 复杂推理、技术⽂档⽣ 成 32B+ 企业级部署(需多卡并联) 暂不⽀持 科研计算、⼤规模数据 处理 2. 算⼒需求分析 模型 参数规 模 计算精 度 最低显存需 求 最低算⼒需求 DeepSeek-R1 (671B) 671B FP8 ≥890GB 2*XE9680(16*H20 GPU) DeepSeek-R1-Distill-0 码力 | 7 页 | 932.77 KB | 8 月前3
人工智能安全治理框架 1.0现实域风险应对 (a)根据用户实际应用场景设置服务提供边界,裁减人工智能系统可能 被滥用的功能,系统提供服务时不应超出预设应用范围。 (b)提高人工智能系统最终用途追溯能力,防止被用于核生化导等大规 模杀伤性武器制造等高危场景。 4.2.3 认知域风险应对 (a)通过技术手段判别不符合预期、不真实、不准确的输出结果,并依 法依规监管。 (b)对收集用户提问信息进行关联分析、汇聚挖掘,进而判断用户身份、0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 普通人如何抓住DeepSeek红利AI的内容生成有一定的边界效应 研究将智能体知识循环边界操作化为生成内容的差异值,衡量标准为生成文本的平均相似度与重复率的加权值。 相似度计算 采用余弦相似度算法,将文本转化为词频向量,计算向量点积 与模长乘积的比值,评估文本间的相似性,取值范围为[-1, 1], 值越接近1表示相似性越高。该方法广泛应用于信息检索和自 然语言处理领域,可有效评估文本内容的相似程度。 重复率计算 使用n-gram方法0 码力 | 65 页 | 4.47 MB | 8 月前3
共 9 条
- 1













