DeepSeek-R1使用指南(简版)DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南0 码力 | 25 页 | 5.57 MB | 8 月前3
DeepSeek图解10页PDF2.3.3 强化学习(Reinforcement Learning, RL) . . . . . . . 7 3 DeepSeek-R1 精华图解 . . . . . . . . . . . . . . . . . . . . . . . 7 3.1 DeepSeek-R1 完整训练过程 . . . . . . . . . . . . . . . . . . . 7 3.1.1 核心创新 1:含 . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . . . . . . . . . . . . . . 10 3.4 总结 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . 个左右的命令,如下图2所示,就能帮我们管理好不同大模型: 图 2: Ollama 常用的命令 第二步,命令窗口输入:ollama pull deepseek-r1:1.5b,下载大模型 deepseek- r1 到我们自己的电脑,如下图3所示: 图 3: DeepSeek-r1 下载到本地电脑命令 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料0 码力 | 11 页 | 2.64 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502DeepSeek出现之前的十大预判 之五 知识的质量和密度决定大模型能力 高质量数据、合成数据使模型知识密度的快速增长 大模型能以更少的参数量达到更高的性能 360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低 过去一年,大模型成本「自由落体」 国外:GPT-4等效智能在过去18个月内价格下降240倍 市场推广创新——让过去很难得到的东西可以得到 商业模式创新——让过去很昂贵的东西变得很便宜甚至免费 DeepSeek正是符合这四种创新模式的完美例子 25 颠覆式创新的四种方式政企、创业者必读 DeepSeek-R1突破了大模型Scaling Law瓶颈 导致大模型悲观论 认为大模型的能力无法进一步得到质的提升 开辟强化学习新范式 从预训练Scaling Law转变为强化学习Scaling Law 预训练范式像是记忆和模仿,强化学习范 式更像探索实践 记住很多东西只是基础,真正有价值的是 融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种政企、创业者必读 快思考 慢思考 快 慢 人类真正智力表现 的形式 直觉经验型 速度快、准确性低 GPT、DeepSeek-V3擅长的 思考方式0 码力 | 76 页 | 5.02 MB | 5 月前3
Deepseek R1 本地部署完全手册复杂推理、技术⽂档⽣ 成 32B+ 企业级部署(需多卡并联) 暂不⽀持 科研计算、⼤规模数据 处理 2. 算⼒需求分析 模型 参数规 模 计算精 度 最低显存需 求 最低算⼒需求 DeepSeek-R1 (671B) 671B FP8 ≥890GB 2*XE9680(16*H20 GPU) DeepSeek-R1-Distill- 70B 70B BF16 ≥180GB 4*L20 或 6. 英伟达NIM:https://build.nvidia.com/deepseek-ai/deepseek-r1 7. Groq:https://groq.com/ 8. Fireworks:https://fireworks.ai/models/fireworks/deepseek-r1 9. Chutes:https://chutes.ai/app/chute/ 10. Github:https://github .com/marketplace/models/azureml-deepseek/DeepSeek- R1/playground 11. POE:https://poe.com/DeepSeek-R1 12. Cursor:https://cursor.sh/ 13. Monica:https://monica.im/invitation?c=ACZ7WJJ9 140 码力 | 7 页 | 932.77 KB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单e k - V 3 , 采 用 创 新 MoE架构和FP8混合精度训练, 训练成本大幅降低 DeepSeek是一家专注通用人工智能(AGl)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能 在多个基准测试中表现出色,对齐OpenAI-O1正式版,甚至在某些任务上表现更优。 DeepSeek发展节点 • 推理能力 • 强化学习驱动:DeepSeek R1-Zero 是首个完全基于强化学习(RL) 训练的推理模型,无需任何监督微调(SFT)步骤,打破传统模型依 赖大量标注数据的惯例。DeepSeek-R1 采用强化学习作为核心训练 方法,显著提升了模型的推理能力和语言表达的可读性。 • 推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模 型综合技能以外,还重点提升了模型在数学、代码、逻辑推理等硬核 FP8混合精度训练 • 推 理 效 率 提 升 : 蒸 馏 后 的 模 型 参 数 量 大 幅 减 少 , 例 如 DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始 的DeepSeek-R1(671B参数),计算复杂度显著降低。 • 性能优化:在代码和数学基准测试中,蒸馏技术显著提升了模 型性能。例如,在基准测试中,蒸馏后的DeepSeek-V2.5模 型在Pass@1和Length指标上均显著优于基线模型。0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。0 码力 | 65 页 | 4.47 MB | 8 月前3
DeepSeek从入门到精通(20250204)DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联 常规绘图 如何使用DeepSeek? https://chat.deepseek.com 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联 如何使用DeepSeek? 网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场中国法研杯CAIL2020司法人工智能赛 第一名 DeepSeek的三种模式 平台 地址 版本 备注 英伟达NIM微服务 https://build.nvidia.com/d eepseek-ai/deepseek-r1 671B(全量模型) 网页版直接使用,支持API调用,注册送1000点数,免费体验。 微软Azure https://ai.azure.com 671B(全量模型) 需注册微软账户并创建订阅,免费部署,支持参数调节。0 码力 | 35 页 | 9.78 MB | 8 月前3
Trends Artificial Intelligence
released – is leading the open-source race, with three large-scale models released in 2025 – DeepSeek-R1, Alibaba Qwen-32B and Baidu Ernie 4.5**. The split has consequences. Open-source is fueling sovereign0 码力 | 340 页 | 12.14 MB | 4 月前3
共 10 条
- 1













