模板层 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

3 年 1 1 月 2 9 日推出670亿参数的通用大模型 D e e p S e e k L L M ，包括 7 B 和67B的base及chat版本发布新一代推理模型 D e e p S e e k - R 1 ，性能与 O p e n A I 的 o 1 正式版持平，并开源 2 0 2 5 年 1 月 2 0 日 2 0 2 4 年 1 推理能力专项提升：在除了利用强化学习模型结合跨领域训练提升模型综合技能以外，还重点提升了模型在数学、代码、逻辑推理等硬核任务上的能力。  推理过程 DeepSeek R1 在推理过程中采用“深度思考”模式，通过展示完整的推理路径来提高模型的可解释性和可信度。在生成答案前展示其推理过程，让用户看到模型如何分解问题并得出结论。包括模型对问题的理解、问题分解、以及逐步求解的过程。决了纯强化学习训练中可能出现的可读性差和语言混杂等问题。第一阶段：推理导向的强化学习基于冷启动数据微调后的基础模型，进行大规模强化学习。此阶段引入语言一致性奖励，优化模型在数学、编程等结构化任务中的表现。第二阶段：拒绝采样与监督微调通过拒绝采样从 R

0 码力 | 85 页 | 8.31 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

频多种介质，在文本生成、图片生成、AI 编程等方向均有出色的表现。 GitHub Copilot 16 / 32 大模型应用现状：知名大模型在全球范围内，已经发布了多款知名大模型，这些大模型在各个领域都取得了突破性的进展。处理文本数据的 GPT-4，能同时处理和理解多种类型数据的多模态模型 DALL-E 3，以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户，构成了机构的大模型产品首批通过《生成式人工智能服务管理暂行办法》备案，可正式上线面向公众提供服务。具体包括：百度（文心一言）、抖音（云雀大模型）、智谱 AI（GLM 大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）、商汤（日日新大模型）、MiniMax （ABAB 大模型）、上海人工智能实验室（书生通用大模型）、腾讯（混元大模型，9月15 日通过）。 18 / 32 大模型应用现状：知名大模型应用是一种基于 LLM 的智能代理，它能够自主学习和执行任务，具有一定的“认知能力和决策能力”。LLM Agent 的出现，标志着 LLM 从传统的模型训练和应用模式，转向以 Agent 为中心的智能化模式。 LLM Agent 打破了传统 LLM 的被动性，使 LLM 能够主动学习和执行任务，从而提高了 LLM 的应用范围和价值；它为 LLM 的智能化发展提供了新的方向，使 LLM 能够更加接近于人类智能。

0 码力 | 32 页 | 13.09 MB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后，继续增大参数规模难以带来质的提升 • 训练算力成本和工程化难度大幅上升强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 33政企、创业者必读新时代下的集中力量办大事  每个企业都可以直接使用DeepSeek，因为开源透明可信任，企业和政府可做大量私有化部署  一个开源产品获得突破之后，全世界都能分享成果，结束中国百模大战，节省大量成本  很多公司参与开源，帮助改进产品，很多人基于DS生态开发应用产品，增加影响力，人人为我，我为人人  技术开放，对人工智能行业形成蓬勃发展，寒武纪大爆炸，推动AGI 从数年缩短到几分钟，解开了生物学密码成功预测了地球存在的2亿种蛋白质结构 45政企、创业者必读  DeepSeek典型的四大安全问题：客户端安全、Agent安全、知识安全、模型安全  360提出「以模制模」新解法，应对DeepSeek安全问题 DeepSeek六大应用方向之六 AI安全：实现安全的「自动驾驶」 46政企、创业者必读大模型的六大能力 47 基本能力业务能力创新

0 码力 | 76 页 | 5.02 MB | 5 月前
3
DeepSeek图解10页PDF

1. 保护隐私与数据安全。数据不外传：本地运行模型可以完全避免数据上传至云端，确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调（Fine-tuning）：可以根据特定业务需求对模型进行微调，以适应特定任务，如行业术语、企业内部知识库等。 3. 离线运行，适用于无网络环境。可在离线环境下运行：适用于无互联网连接或网络受限的场景。提高系统稳定性：即使云服务宕机，本地大模型依 ented Reinforcement Learn- ing）得到中间推理模型（Iterim reasoning model）, 图8会详细解释中间模型的训练过程。 DeepSeek-R1 核心贡献：首次验证了通过纯强化学习也能大幅提升大模型推理能力，开源纯强化学习推理模型 DeepSeek-R1-Zero R1-Zero 能生成高质量的推理数据，包括大量长链式思维（Chain-of-Thought

0 码力 | 11 页 | 2.64 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

口协议、性能评定、试验方法等技术要求，包括智能传感器的架构、指令、数据格式、信息提取方法、信息融合方法、功能集成方法、性能指标和评价方法等标准。 4. 计算设备标准。规范人工智能加速卡、人工智能加速模组、人工智能服务器等计算设备，及使能软件的技术要求和测试方法，包括人工智能计算设备虚拟化方法，人工智能加速模组接口协议和测试方法，及使能软件的访问协议、功能、性能、能效的测试方法和运行维护要求等标准。群体智能标准。规范群体智能算法的控制、编队、感知、规划、决策、通信等技术要求和评测方法，包括自主控制、协同控制、任务规划、路径规划、协同决策、组网通信等标准。 11. 跨媒体智能标准。规范文本、图像、视频、音频等多模态数据处理基础、转换分析、融合应用等方面的技术要求，包括数据获取与处理、模态转换、模态对齐、融合与协同、应用扩展等标准。 12. 具身智能标准。规范多模态主动与交互、自主行为学习、仿

0 码力 | 13 页 | 701.84 KB | 1 年前
3
普通人学AI指南

界面简洁但因表情符出现又不失枯燥 4 零代码搭建本地 AI 前端到目前，我们使用大模型的界面还是一个终端窗口，黑乎乎的，交互不友好。这章教你搭建一个美观炫酷的前端网页，如图 20所示，让你使用本地大模型，更方便！更舒心！关键搭建简单，顺利的话，三五分钟搞定。后面完全免费畅享使用大模型！ Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 名为 lobe-chat 的 Docker 容器，并设置一些特定参数： docker run ：启动并运行一个新的 Docker 容器。 -d：在后台（守护进程模式）运行容器，不会占用当前终端。 --name lobe-chat ：给容器分配一个名称 lobe-chat 。这有助于以后通过名称管

0 码力 | 42 页 | 8.39 MB | 8 月前
3
Deepseek R1 本地部署完全手册

32GB（M3 Max） - 存储: 20GB 复杂推理、技术⽂档⽣成 32B+ 企业级部署（需多卡并联）暂不⽀持科研计算、⼤规模数据处理 2. 算⼒需求分析模型参数规模计算精度最低显存需求最低算⼒需求 DeepSeek-R1 (671B) 671B FP8 ≥890GB 2*XE9680（16*H20 GPU） DeepSeek-R1-Distill-

0 码力 | 7 页 | 932.77 KB | 8 月前
3
人工智能安全治理框架 1.0

现实域风险应对（a）根据用户实际应用场景设置服务提供边界，裁减人工智能系统可能被滥用的功能，系统提供服务时不应超出预设应用范围。（b）提高人工智能系统最终用途追溯能力，防止被用于核生化导等大规模杀伤性武器制造等高危场景。 4.2.3 认知域风险应对（a）通过技术手段判别不符合预期、不真实、不准确的输出结果，并依法依规监管。（b）对收集用户提问信息进行关联分析、汇聚挖掘，进而判断用户身份、

0 码力 | 20 页 | 3.79 MB | 1 月前
3
清华大学普通人如何抓住DeepSeek红利

AI的内容生成有一定的边界效应研究将智能体知识循环边界操作化为生成内容的差异值，衡量标准为生成文本的平均相似度与重复率的加权值。相似度计算采用余弦相似度算法，将文本转化为词频向量，计算向量点积与模长乘积的比值，评估文本间的相似性，取值范围为[-1, 1]，值越接近1表示相似性越高。该方法广泛应用于信息检索和自然语言处理领域，可有效评估文本内容的相似程度。重复率计算使用n-gram方法

0 码力 | 65 页 | 4.47 MB | 8 月前
3

共 9 条前往

页

分类

语言

格式