 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet  平衡性能:在模型大小和 性能之间取得平衡,适合 create a table? 切分数据 Can you create a graph using this data? 制作一个图 Can you create a world cloud? 做一个词云 Can you create a chart using this data? 画一个图表 What are the rows and columns in this dataset? 描述一下行和列 月 2 0 日 2 0 2 4 年 1 2 月 2 6 日 发 布 总 参 数 达 6 7 1 0 亿 的 D e e p S e e k - V 3 , 采 用 创 新 MoE架构和FP8混合精度训练, 训练成本大幅降低 DeepSeek是一家专注通用人工智能(AGl)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能0 码力 | 85 页 | 8.31 MB | 8 月前3 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet  平衡性能:在模型大小和 性能之间取得平衡,适合 create a table? 切分数据 Can you create a graph using this data? 制作一个图 Can you create a world cloud? 做一个词云 Can you create a chart using this data? 画一个图表 What are the rows and columns in this dataset? 描述一下行和列 月 2 0 日 2 0 2 4 年 1 2 月 2 6 日 发 布 总 参 数 达 6 7 1 0 亿 的 D e e p S e e k - V 3 , 采 用 创 新 MoE架构和FP8混合精度训练, 训练成本大幅降低 DeepSeek是一家专注通用人工智能(AGl)的中国科技公司,主攻大模型研发与应用。 DeepSeek-R1是其最新发布并开源的推理模型,擅长处理复杂任务且可免费商用,其性能0 码力 | 85 页 | 8.31 MB | 8 月前3
 Deepseek R1 本地部署完全手册32B 壁彻算⼒平台+昇腾910B集群 科研计算与多模态处理 四、云端部署替代⽅案 1. 国内云服务商推荐 平台 核⼼优势 适⽤场景 硅基流动 官⽅推荐API,低延迟,⽀持多模态模型 企业级⾼并发推理 腾讯云 ⼀键部署+限时免费体验,⽀持VPC私有化 中⼩规模模型快速上线 PPIO派欧云 价格仅为OpenAI 1/20,注册赠5000万tokens 低成本尝鲜与测试 2. 国际接⼊渠道(需魔法或外企上⽹环境 GB ≥500 GB ⾼性能服务器/云GPU 下载地址: HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议 硬件类型 推荐配置 性能表现(短⽂本⽣成) 消费级设备 Mac Studio(192GB统⼀内存) 10+ token/秒 ⾼性能服务器 4×RTX 4090(96GB显存+384GB内存) 7-8 token/秒(混合推理) 3. 部署步骤(Linux示例) cn/i/OBklluwO 4. 字节跳动⽕⼭引擎:https://console.volcengine.com/ark/region:ark+cn-beijing/experience 5. 百度云千帆:https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 6. 英伟达NIM:https://build.nvidia0 码力 | 7 页 | 932.77 KB | 8 月前3 Deepseek R1 本地部署完全手册32B 壁彻算⼒平台+昇腾910B集群 科研计算与多模态处理 四、云端部署替代⽅案 1. 国内云服务商推荐 平台 核⼼优势 适⽤场景 硅基流动 官⽅推荐API,低延迟,⽀持多模态模型 企业级⾼并发推理 腾讯云 ⼀键部署+限时免费体验,⽀持VPC私有化 中⼩规模模型快速上线 PPIO派欧云 价格仅为OpenAI 1/20,注册赠5000万tokens 低成本尝鲜与测试 2. 国际接⼊渠道(需魔法或外企上⽹环境 GB ≥500 GB ⾼性能服务器/云GPU 下载地址: HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议 硬件类型 推荐配置 性能表现(短⽂本⽣成) 消费级设备 Mac Studio(192GB统⼀内存) 10+ token/秒 ⾼性能服务器 4×RTX 4090(96GB显存+384GB内存) 7-8 token/秒(混合推理) 3. 部署步骤(Linux示例) cn/i/OBklluwO 4. 字节跳动⽕⼭引擎:https://console.volcengine.com/ark/region:ark+cn-beijing/experience 5. 百度云千帆:https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 6. 英伟达NIM:https://build.nvidia0 码力 | 7 页 | 932.77 KB | 8 月前3
 DeepSeek图解10页PDF据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 然可以正常工作,不受外部因素影响。 本教程搭建 DeepSeek 好处 本地搭建 DeepSeek 三个比较实际的好处: • 本教程接入的是 DeepSeek 推理模型 CoT)示例,用于支持后续的 SFT 阶段,如图7所示。更加详细介绍参考3.2节。 3.1.2 核心创新 2:通用强化学习 第一阶段 R1-Zero 虽然展现出惊人的推理能力提升,但是也出现了回复时 语言混合,非推理任务回复效果差的问题,为了解决这些问题,DeepSeek 提出通用强化学习训练框架。 如图7所示,通用强化学习(General Reinforcement Learning)基于 SFT-0 码力 | 11 页 | 2.64 MB | 8 月前3 DeepSeek图解10页PDF据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 连接或网络受限的场景。提高系统稳定性:即使云服务宕机,本地大模型依 然可以正常工作,不受外部因素影响。 本教程搭建 DeepSeek 好处 本地搭建 DeepSeek 三个比较实际的好处: • 本教程接入的是 DeepSeek 推理模型 CoT)示例,用于支持后续的 SFT 阶段,如图7所示。更加详细介绍参考3.2节。 3.1.2 核心创新 2:通用强化学习 第一阶段 R1-Zero 虽然展现出惊人的推理能力提升,但是也出现了回复时 语言混合,非推理任务回复效果差的问题,为了解决这些问题,DeepSeek 提出通用强化学习训练框架。 如图7所示,通用强化学习(General Reinforcement Learning)基于 SFT-0 码力 | 11 页 | 2.64 MB | 8 月前3
 国家人工智能产业综合标准化体系建设指南(2024版)所示。其中,基础共性标准是人 工智能的基础性、框架性、总体性标准。基础支撑标准主要 规范数据、算力、算法等技术要求,为人工智能产业发展夯 实技术底座。关键技术标准主要规范人工智能文本、语音、 图像,以及人机混合增强智能、智能体、跨媒体智能、具身 智能等的技术要求,推动人工智能技术创新和应用。智能产 品与服务标准主要规范由人工智能技术形成的智能产品和 服务模式。赋能新型工业化标准主要规范人工智能技术赋能 布式计算等软硬件 协同任务的交互协议、执行效率和协同性能等标准。 (三)关键技术标准 关键技术标准主要包括机器学习、知识图谱、大模型、自然 语言处理、智能语音、计算机视觉、生物特征识别、人机混合增 强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、 模型表达和格式、模型效果评价等,包括自监督学习、无监督学 习、半监督学习、深度学习、强化学习等标准。 求和评价方法,包括功能、性能、可维护性等标准。 7. 生物特征识别标准。规范生物特征样本处理、生物特征 数据协议、设备或系统等技术要求,包括生物特征数据交换格式、 接口协议等标准。 8. 人机混合增强智能标准。规范多通道、多模式和多维度 的交互途径、模式、方法和技术要求,包括脑机接口、在线知识 演化、动态自适应、动态识别、人机协同感知、人机协同决策与 控制等标准。 9. 智能体标准。规范以通用大模型为核心的智能体实例和0 码力 | 13 页 | 701.84 KB | 1 年前3 国家人工智能产业综合标准化体系建设指南(2024版)所示。其中,基础共性标准是人 工智能的基础性、框架性、总体性标准。基础支撑标准主要 规范数据、算力、算法等技术要求,为人工智能产业发展夯 实技术底座。关键技术标准主要规范人工智能文本、语音、 图像,以及人机混合增强智能、智能体、跨媒体智能、具身 智能等的技术要求,推动人工智能技术创新和应用。智能产 品与服务标准主要规范由人工智能技术形成的智能产品和 服务模式。赋能新型工业化标准主要规范人工智能技术赋能 布式计算等软硬件 协同任务的交互协议、执行效率和协同性能等标准。 (三)关键技术标准 关键技术标准主要包括机器学习、知识图谱、大模型、自然 语言处理、智能语音、计算机视觉、生物特征识别、人机混合增 强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、 模型表达和格式、模型效果评价等,包括自监督学习、无监督学 习、半监督学习、深度学习、强化学习等标准。 求和评价方法,包括功能、性能、可维护性等标准。 7. 生物特征识别标准。规范生物特征样本处理、生物特征 数据协议、设备或系统等技术要求,包括生物特征数据交换格式、 接口协议等标准。 8. 人机混合增强智能标准。规范多通道、多模式和多维度 的交互途径、模式、方法和技术要求,包括脑机接口、在线知识 演化、动态自适应、动态识别、人机协同感知、人机协同决策与 控制等标准。 9. 智能体标准。规范以通用大模型为核心的智能体实例和0 码力 | 13 页 | 701.84 KB | 1 年前3
 DeepSeek从入门到精通(20250204)描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 Combine(组合):整合多个想法 • Unify(统一):创建一致的叙述或解决方案 • Synthesize(综合):形成最终结论 跨界思维的提示语链设计 基于“BRIDGE”框架 • Blend(混合):融合不同领域的概念 • Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 Combine(组合):整合多个想法 • Unify(统一):创建一致的叙述或解决方案 • Synthesize(综合):形成最终结论 跨界思维的提示语链设计 基于“BRIDGE”框架 • Blend(混合):融合不同领域的概念 • Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 Combine(组合):整合多个想法 • Unify(统一):创建一致的叙述或解决方案 • Synthesize(综合):形成最终结论 跨界思维的提示语链设计 基于“BRIDGE”框架 • Blend(混合):融合不同领域的概念 • Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 Combine(组合):整合多个想法 • Unify(统一):创建一致的叙述或解决方案 • Synthesize(综合):形成最终结论 跨界思维的提示语链设计 基于“BRIDGE”框架 • Blend(混合):融合不同领域的概念 • Reframe(重构):用新视角看待问题 • Interconnect(互联):建立领域间的联系 • Decontextualize(去情境化):将概念从原始环 境中抽离0 码力 | 103 页 | 5.40 MB | 8 月前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502认知决定行动,这场全民AI科普对推动中国AI发展功不可没政企、创业者必读 开源改变行业格局,建立强大生态  开源战胜闭源,促使全球公司、开发者等转到开源  建立强大生态,成为全球人工智能根技术,无推广情况下各国 政府、企业、云厂商纷纷接入,获得全球最大影响力  改变中美竞争格局:美国是闭源封闭垄断思路,中国领导开源 文化,加速中国领先地位  中国人民使用的AI工具先进性已超过美国,普及率超过美国, 使用AI人口 ,形成分布式推理网络  技术门槛降低, 可标准化、SaaS化部署,下载就能用 DeepSeek颠覆式创新——成本暴跌 35政企、创业者必读 惠及全球人民,科技平权,技术平民化  运营商、云服务可免费用,降低云服务成本  大型企业可使用多个DeepSeek,解决不同场景需求  中小企业免费部署,消除数字鸿沟  个人可以拥有自己的DeepSeek ,可以成为超级个体  对于创业者得 质量缺陷预分析及预警 • 质量评价模型优化 • 冷态钢管缺陷检测 • 厂区智慧物流 • 生产计划智能优化 • 炉次计划优化算法(智能排产) • 综合物流调度 • 碳资源交易与碳金融 • 中鑫联云商平台风险控制 场景选择示例——钢铁大模型 57政企、创业者必读 有了场景之后,只有DeepSeek还不够 大模型就像培养器中的大脑 会理解、能问答、能生成,但是没有记忆能力,不会使用工具,0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502认知决定行动,这场全民AI科普对推动中国AI发展功不可没政企、创业者必读 开源改变行业格局,建立强大生态  开源战胜闭源,促使全球公司、开发者等转到开源  建立强大生态,成为全球人工智能根技术,无推广情况下各国 政府、企业、云厂商纷纷接入,获得全球最大影响力  改变中美竞争格局:美国是闭源封闭垄断思路,中国领导开源 文化,加速中国领先地位  中国人民使用的AI工具先进性已超过美国,普及率超过美国, 使用AI人口 ,形成分布式推理网络  技术门槛降低, 可标准化、SaaS化部署,下载就能用 DeepSeek颠覆式创新——成本暴跌 35政企、创业者必读 惠及全球人民,科技平权,技术平民化  运营商、云服务可免费用,降低云服务成本  大型企业可使用多个DeepSeek,解决不同场景需求  中小企业免费部署,消除数字鸿沟  个人可以拥有自己的DeepSeek ,可以成为超级个体  对于创业者得 质量缺陷预分析及预警 • 质量评价模型优化 • 冷态钢管缺陷检测 • 厂区智慧物流 • 生产计划智能优化 • 炉次计划优化算法(智能排产) • 综合物流调度 • 碳资源交易与碳金融 • 中鑫联云商平台风险控制 场景选择示例——钢铁大模型 57政企、创业者必读 有了场景之后,只有DeepSeek还不够 大模型就像培养器中的大脑 会理解、能问答、能生成,但是没有记忆能力,不会使用工具,0 码力 | 76 页 | 5.02 MB | 5 月前3
 人工智能安全治理框架 1.0可以回退到以前的商用版本。 (g)研发者应定期开展安全评估测试,测试前明确测试目标、范围和安 全维度,构建多样化的测试数据集,涵盖各种应用场景。 (h)研发者应制定明确的测试规则和方法,包括人工测试、自动测试、 混合测试等,利用沙箱仿真等技术对模型进行充分测试和验证。 (i) 研发者应评估人工智能模型算法对外界干扰的容忍程度,以适用范 围、注意事项或使用禁忌的形式告知服务提供者和使用者。 (j) 研发者应0 码力 | 20 页 | 3.79 MB | 1 月前3 人工智能安全治理框架 1.0可以回退到以前的商用版本。 (g)研发者应定期开展安全评估测试,测试前明确测试目标、范围和安 全维度,构建多样化的测试数据集,涵盖各种应用场景。 (h)研发者应制定明确的测试规则和方法,包括人工测试、自动测试、 混合测试等,利用沙箱仿真等技术对模型进行充分测试和验证。 (i) 研发者应评估人工智能模型算法对外界干扰的容忍程度,以适用范 围、注意事项或使用禁忌的形式告知服务提供者和使用者。 (j) 研发者应0 码力 | 20 页 | 3.79 MB | 1 月前3
 开源中国 2023 大模型(LLM)技术报告持快速迭代和大规模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning 都是提供端到 端机器学习服务的云平台。 这些工具和库专门为加速机器学习模型的训练和推理而设计,通常利 用 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 的速度、效率和能力。 是全球领先的 GPU 制造商,提供了强大的图形处理单元,专门用于深度学习和AI计算。 AI 处理器和基础软件构建 Atlas 人工智能计算解决 方案,打造面向“端、边、云”的全场景 AI 基础设施方案,覆盖深度学习领域推理和训练全流程。 被外界视为打破 NVIDIA 垄断 AI 算力市场的多一种选择,其基于第三代 CDNA 架构,为生 成式 AI 大语言模型设计的 GPGPU 架构为基础,兼容通用的“类 CUDA”环境以及国际主流商业计 算软件和人工智能软件,可广泛应用于大数据处理、人工智能、商业计算等应用领域。 通用 GPU 高端芯片及超级算力系统提供商。拥有云边协同、训推组合的完整通用算力 系统全方案,其系统架构、指令集、核心算子、软件栈均为自主研发,可独立发展演进。 30 / 32 LLM 世界的基石:算力 算力也是全国乃至世界范围内 LLM 相关企业遇到的最大难题:0 码力 | 32 页 | 13.09 MB | 1 年前3 开源中国 2023 大模型(LLM)技术报告持快速迭代和大规模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning 都是提供端到 端机器学习服务的云平台。 这些工具和库专门为加速机器学习模型的训练和推理而设计,通常利 用 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 的速度、效率和能力。 是全球领先的 GPU 制造商,提供了强大的图形处理单元,专门用于深度学习和AI计算。 AI 处理器和基础软件构建 Atlas 人工智能计算解决 方案,打造面向“端、边、云”的全场景 AI 基础设施方案,覆盖深度学习领域推理和训练全流程。 被外界视为打破 NVIDIA 垄断 AI 算力市场的多一种选择,其基于第三代 CDNA 架构,为生 成式 AI 大语言模型设计的 GPGPU 架构为基础,兼容通用的“类 CUDA”环境以及国际主流商业计 算软件和人工智能软件,可广泛应用于大数据处理、人工智能、商业计算等应用领域。 通用 GPU 高端芯片及超级算力系统提供商。拥有云边协同、训推组合的完整通用算力 系统全方案,其系统架构、指令集、核心算子、软件栈均为自主研发,可独立发展演进。 30 / 32 LLM 世界的基石:算力 算力也是全国乃至世界范围内 LLM 相关企业遇到的最大难题:0 码力 | 32 页 | 13.09 MB | 1 年前3
 清华大学 普通人如何抓住DeepSeek红利描述问题背景与目标, 由模型规划解决路径 复杂问题 、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案 。 ” 激发模型深层推理 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺, 且 预算控制在2000元内 。 ” 兼顾目标与细节 需避免过度约束0 码力 | 65 页 | 4.47 MB | 8 月前3 清华大学 普通人如何抓住DeepSeek红利描述问题背景与目标, 由模型规划解决路径 复杂问题 、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案 。 ” 激发模型深层推理 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺, 且 预算控制在2000元内 。 ” 兼顾目标与细节 需避免过度约束0 码力 | 65 页 | 4.47 MB | 8 月前3
共 11 条
- 1
- 2













