 DeepSeek从入门到精通(20250204)表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" �实战技巧: 执行需求 �实战技巧: "将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。" 创造性需求 "设计一款智能家居产品,要求: ① 解决独居老人安全问题; ② 结合传感器网络和AI预警; 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语 利用类比、反向思考等技巧拓展AI输出的可能性 巧妙结合不同领域概念,产生跨界创新 结果优化能力 分析AI输出,识别改进空间 通过迭代调整提示语,优化输出质量 设计评估标准,量化提示语效果 跨域整合能力 将专业领域知识转化为有效的提示语 利用提示语桥接不同学科和AI能力 创造跨领域的创新解决方案 系统思维0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" �实战技巧: 执行需求 �实战技巧: "将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。" 创造性需求 "设计一款智能家居产品,要求: ① 解决独居老人安全问题; ② 结合传感器网络和AI预警; 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语 利用类比、反向思考等技巧拓展AI输出的可能性 巧妙结合不同领域概念,产生跨界创新 结果优化能力 分析AI输出,识别改进空间 通过迭代调整提示语,优化输出质量 设计评估标准,量化提示语效果 跨域整合能力 将专业领域知识转化为有效的提示语 利用提示语桥接不同学科和AI能力 创造跨领域的创新解决方案 系统思维0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" �实战技巧: 执行需求 �实战技巧: "将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。" 创造性需求 "设计一款智能家居产品,要求: ① 解决独居老人安全问题; ② 结合传感器网络和AI预警; 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语 利用类比、反向思考等技巧拓展AI输出的可能性 巧妙结合不同领域概念,产生跨界创新 结果优化能力 分析AI输出,识别改进空间 通过迭代调整提示语,优化输出质量 设计评估标准,量化提示语效果 跨域整合能力 将专业领域知识转化为有效的提示语 利用提示语桥接不同学科和AI能力 创造跨领域的创新解决方案 系统思维0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" �实战技巧: 执行需求 �实战技巧: "将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。" 创造性需求 "设计一款智能家居产品,要求: ① 解决独居老人安全问题; ② 结合传感器网络和AI预警; 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语 利用类比、反向思考等技巧拓展AI输出的可能性 巧妙结合不同领域概念,产生跨界创新 结果优化能力 分析AI输出,识别改进空间 通过迭代调整提示语,优化输出质量 设计评估标准,量化提示语效果 跨域整合能力 将专业领域知识转化为有效的提示语 利用提示语桥接不同学科和AI能力 创造跨领域的创新解决方案 系统思维0 码力 | 103 页 | 5.40 MB | 8 月前3
 清华大学 普通人如何抓住DeepSeek红利l 文本创作 文章/故事/诗歌写作 营销文案 、广告语生成 社交媒体内容(如推文 、帖子) 剧本或对话设计 l 摘要与改写 长文本摘要(论文 、报告) 文本简化(降低复杂度) 多语言翻译与本地化 l 结构化生成 表格 、列表生成(如日程安排 、 菜谱) 代码注释 、文档撰写 文本生成 文本生成 03 02 01 语义分析 • 语义解析 • 情感分析(评论、反馈) 你已经预料到会被问到婚姻 问题。七大姑八大姨们纷纷关心你的婚恋状况,问题接二连三地抛来,让你感到压力重重。 目标:在不伤害长辈感情的情况下,妥善处理亲戚的催婚问题,维护家庭和谐,同时保护自己的个人空间和选择。 对话技巧 p 使用“我”语句:如“我感到…”,避免指责。 p 运用幽默:如“现在我还是专心工作,等以后有了 对象再来麻烦您操心!” p 避免冲突:寻找共同点,如“您说得对,婚姻很重 p 坦诚交流,表达立场 示例:温和地说明,“我现在在工作上有些目标想要实 现,婚姻大事需要时间和精准的选择。” p 设定界限,明确底线 示例:礼貌但坚定地说,“我会认真考虑,但希望能有 自己的空间去选择。” p 转移话题,缓解气氛 示例:主动询问,“您最近有什么新鲜事吗?我听说您 最近在学习摄影?” p 寻求家长支持 示例:私下对父母说,“我知道大家都很关心我,但我 希望能有时间去寻找合适的伴侣,希望您能理解和支持0 码力 | 65 页 | 4.47 MB | 8 月前3 清华大学 普通人如何抓住DeepSeek红利l 文本创作 文章/故事/诗歌写作 营销文案 、广告语生成 社交媒体内容(如推文 、帖子) 剧本或对话设计 l 摘要与改写 长文本摘要(论文 、报告) 文本简化(降低复杂度) 多语言翻译与本地化 l 结构化生成 表格 、列表生成(如日程安排 、 菜谱) 代码注释 、文档撰写 文本生成 文本生成 03 02 01 语义分析 • 语义解析 • 情感分析(评论、反馈) 你已经预料到会被问到婚姻 问题。七大姑八大姨们纷纷关心你的婚恋状况,问题接二连三地抛来,让你感到压力重重。 目标:在不伤害长辈感情的情况下,妥善处理亲戚的催婚问题,维护家庭和谐,同时保护自己的个人空间和选择。 对话技巧 p 使用“我”语句:如“我感到…”,避免指责。 p 运用幽默:如“现在我还是专心工作,等以后有了 对象再来麻烦您操心!” p 避免冲突:寻找共同点,如“您说得对,婚姻很重 p 坦诚交流,表达立场 示例:温和地说明,“我现在在工作上有些目标想要实 现,婚姻大事需要时间和精准的选择。” p 设定界限,明确底线 示例:礼貌但坚定地说,“我会认真考虑,但希望能有 自己的空间去选择。” p 转移话题,缓解气氛 示例:主动询问,“您最近有什么新鲜事吗?我听说您 最近在学习摄影?” p 寻求家长支持 示例:私下对父母说,“我知道大家都很关心我,但我 希望能有时间去寻找合适的伴侣,希望您能理解和支持0 码力 | 65 页 | 4.47 MB | 8 月前3
 Deepseek R1 本地部署完全手册码补全 7B - RAM: 8-10GB - GPU: GTX 1680(4-bit量 化) - 存储: 8GB - 内存: 16GB(M2 Pro/M3) - 存储: 8GB 中等复杂度问答、代码 调试 14B - RAM: 24GB - GPU: RTX 3090(24GB VRAM) - 存储: 20GB - 内存: 32GB(M3 Max) - 存储: 20GB 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile: 5. 运⾏模型: 4. 性能调优与测试 GPU利⽤率低:升级⾼带宽内存(如DDR5 5600+)。 扩展交换空间: 六、注意事项与⻛险提示 1. 成本警示: 70B模型:需3张以上80G显存显卡(如RTX A6000),单卡⽤户不可⾏。 671B模型:需8xH100集群,仅限超算中⼼部署。 2. 替代⽅案:0 码力 | 7 页 | 932.77 KB | 8 月前3 Deepseek R1 本地部署完全手册码补全 7B - RAM: 8-10GB - GPU: GTX 1680(4-bit量 化) - 存储: 8GB - 内存: 16GB(M2 Pro/M3) - 存储: 8GB 中等复杂度问答、代码 调试 14B - RAM: 24GB - GPU: RTX 3090(24GB VRAM) - 存储: 20GB - 内存: 32GB(M3 Max) - 存储: 20GB 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile: 5. 运⾏模型: 4. 性能调优与测试 GPU利⽤率低:升级⾼带宽内存(如DDR5 5600+)。 扩展交换空间: 六、注意事项与⻛险提示 1. 成本警示: 70B模型:需3张以上80G显存显卡(如RTX A6000),单卡⽤户不可⾏。 671B模型:需8xH100集群,仅限超算中⼼部署。 2. 替代⽅案:0 码力 | 7 页 | 932.77 KB | 8 月前3
 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 内存和计算开销,在推理中降低了 KV缓存占用空间。 多头潜在注意力(MLA)机制 通过序列化预测未来多个令牌,增强 模型的上下文建模能力,并支持推测 解码加速推理。MTP在特定场景下同 时预测多个令牌,提高信号密度,减 少上下文漂移和逻辑连贯性问题。 蒸 馏 后 的 模 型 参 数 量 大 幅 减 少 , 例 如 DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始 的DeepSeek-R1(671B参数),计算复杂度显著降低。 • 性能优化:在代码和数学基准测试中,蒸馏技术显著提升了模 型性能。例如,在基准测试中,蒸馏后的DeepSeek-V2.5模 型在Pass@1和Length指标上均显著优于基线模型。 芯片、 云平台、操作系统等产业的发展。 技术深化:突破局限,能力提升 DeepSeek R1展示了强化学习技术和算法创新在 AI 领域的巨大潜力,但其仍然处于发展阶段,存在一定局限性和优化 空间。未来,随着技术的不断进步和创新,DeepSeek R1 可能会在以下几个方面实现进一步的突破: 通用能力提升 解决语言混杂问题 目前,DeepSeek R1在函数调用、多轮 对话、复杂角色扮演和0 码力 | 85 页 | 8.31 MB | 8 月前3 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 内存和计算开销,在推理中降低了 KV缓存占用空间。 多头潜在注意力(MLA)机制 通过序列化预测未来多个令牌,增强 模型的上下文建模能力,并支持推测 解码加速推理。MTP在特定场景下同 时预测多个令牌,提高信号密度,减 少上下文漂移和逻辑连贯性问题。 蒸 馏 后 的 模 型 参 数 量 大 幅 减 少 , 例 如 DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始 的DeepSeek-R1(671B参数),计算复杂度显著降低。 • 性能优化:在代码和数学基准测试中,蒸馏技术显著提升了模 型性能。例如,在基准测试中,蒸馏后的DeepSeek-V2.5模 型在Pass@1和Length指标上均显著优于基线模型。 芯片、 云平台、操作系统等产业的发展。 技术深化:突破局限,能力提升 DeepSeek R1展示了强化学习技术和算法创新在 AI 领域的巨大潜力,但其仍然处于发展阶段,存在一定局限性和优化 空间。未来,随着技术的不断进步和创新,DeepSeek R1 可能会在以下几个方面实现进一步的突破: 通用能力提升 解决语言混杂问题 目前,DeepSeek R1在函数调用、多轮 对话、复杂角色扮演和0 码力 | 85 页 | 8.31 MB | 8 月前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二)  从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI  从数字空间中的AI,走向能理解和操控物理空间的AI  从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 34政企、创业者必读 成本的急剧降低  DeepSeek可适配国产硬件,促进国产硬件发展  DeepSeek的优化降低对推理硬件的要求,减少推理成本  训练成本降低,堆显卡模式受质疑,探索新思路,算法优化空间大  无需训练自己的基座模型,直接部署在DeepSeek上,不用重复发明轮子  公开蒸馏方法,帮助其他模型提升能力,实现了模型制造模型,犹如工业母机  小模型可部署在企业内电脑或一体机上,使用成本降低,形成分布式推理网络0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二)  从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI  从数字空间中的AI,走向能理解和操控物理空间的AI  从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 34政企、创业者必读 成本的急剧降低  DeepSeek可适配国产硬件,促进国产硬件发展  DeepSeek的优化降低对推理硬件的要求,减少推理成本  训练成本降低,堆显卡模式受质疑,探索新思路,算法优化空间大  无需训练自己的基座模型,直接部署在DeepSeek上,不用重复发明轮子  公开蒸馏方法,帮助其他模型提升能力,实现了模型制造模型,犹如工业母机  小模型可部署在企业内电脑或一体机上,使用成本降低,形成分布式推理网络0 码力 | 76 页 | 5.02 MB | 5 月前3
 开源中国 2023 大模型(LLM)技术报告。 PromptPerfect 29 / 32 LLM 世界的基石:算力 LLM 的算力指的是执行这些模型所需的计算资源。这包括用于训练和运行模型的硬件(如 GPU 或 TPU)、内存、存储空间以及处理 大量数据的能力。LLM 需要非常强大的算力来处理、理解和生成文本,因为它们涉及到数十亿甚至数万亿个参数的训练和推理。 LLM 的基石是算力,而算力的基石是硬件,硬件的性能直接影响着计算任务的速度、效率和能力。0 码力 | 32 页 | 13.09 MB | 1 年前3 开源中国 2023 大模型(LLM)技术报告。 PromptPerfect 29 / 32 LLM 世界的基石:算力 LLM 的算力指的是执行这些模型所需的计算资源。这包括用于训练和运行模型的硬件(如 GPU 或 TPU)、内存、存储空间以及处理 大量数据的能力。LLM 需要非常强大的算力来处理、理解和生成文本,因为它们涉及到数十亿甚至数万亿个参数的训练和推理。 LLM 的基石是算力,而算力的基石是硬件,硬件的性能直接影响着计算任务的速度、效率和能力。0 码力 | 32 页 | 13.09 MB | 1 年前3
 普通人学AI指南提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 1.4.1 上下文窗口 上下文窗口指的是模型一次可以处理的最大文本长度。这个长度通常用“to-0 码力 | 42 页 | 8.39 MB | 8 月前3 普通人学AI指南提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 1.4.1 上下文窗口 上下文窗口指的是模型一次可以处理的最大文本长度。这个长度通常用“to-0 码力 | 42 页 | 8.39 MB | 8 月前3
 人工智能安全治理框架 1.0(b)用于开展认知战的风险。人工智能可被利用于制作传播虚假新闻、- 7 - 人工智能安全治理框架 图像、音频、视频等,宣扬恐怖主义、极端主义、有组织犯罪等内容,干涉他 国内政、社会制度及社会秩序,危害他国主权;通过社交机器人在网络空间抢 占话语权和议程设置权,左右公众价值观和思维认知。 3.2.4 伦理域安全风险 (a)加剧社会歧视偏见、扩大智能鸿沟的风险。利用人工智能收集分析 人类行为、社会地位、经济状态、个体性格等,对不同人群进行标识分类、区0 码力 | 20 页 | 3.79 MB | 1 月前3 人工智能安全治理框架 1.0(b)用于开展认知战的风险。人工智能可被利用于制作传播虚假新闻、- 7 - 人工智能安全治理框架 图像、音频、视频等,宣扬恐怖主义、极端主义、有组织犯罪等内容,干涉他 国内政、社会制度及社会秩序,危害他国主权;通过社交机器人在网络空间抢 占话语权和议程设置权,左右公众价值观和思维认知。 3.2.4 伦理域安全风险 (a)加剧社会歧视偏见、扩大智能鸿沟的风险。利用人工智能收集分析 人类行为、社会地位、经济状态、个体性格等,对不同人群进行标识分类、区0 码力 | 20 页 | 3.79 MB | 1 月前3
共 9 条
- 1













