【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502应用场景之战 大模型安全之战 • 探索超越人类的超级人工 智能AGI • 不仅是科技之争,更是国 运之争 • 不发展是最大的不安全, 发挥举国体制优势,打赢 追赶之战 • 大模型带来前所未有安全 挑战 • 外挂式传统安全手段难以 应对 • 应对模型安全新挑战,打 赢未雨绸缪之战 • 大模型是能力而非产品, 结合场景才能发挥价值 • 中国拥有最完整的产业链、 最全的工业门类、最丰富 的场景 • 产业数转智改,打赢弯道 超车之战 AGI是全球少数玩家的游戏,政府、企业、创业者更多创新的机会在应用之路 11政企、创业者必读 把大模型拉下神坛! 走入千家万户、百行千业,才能掀起新工业革命 • 当年IBM做出超级电脑,并没有带来工业 革命,因为只有少数人用 • IBM甚至声称,全世界只用5台电脑就够了 • 真正带来信息革命的是个人电脑走入千家 万户、百行千业 当年的电脑 当今的大模型 • 如果需要十万或百万张卡起玩,就无法 全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式 大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」 大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判 之三 模型越做越专 除了少数科技巨头,大多数公司都专注于做专业大模型 MoE架构盛行,本质是多个专家模型组成一个大模型 De0 码力 | 76 页 | 5.02 MB | 5 月前3
开源中国 2023 大模型(LLM)技术报告DCU 系列产品以 GPGPU 架构为基础,兼容通用的“类 CUDA”环境以及国际主流商业计 算软件和人工智能软件,可广泛应用于大数据处理、人工智能、商业计算等应用领域。 通用 GPU 高端芯片及超级算力系统提供商。拥有云边协同、训推组合的完整通用算力 系统全方案,其系统架构、指令集、核心算子、软件栈均为自主研发,可独立发展演进。 30 / 32 LLM 世界的基石:算力 算力也是全国乃至世界范围内0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek从入门到精通(20250204)推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如: 目标 + 选项 + 评估标准 要求逻辑推演和量化分析 直接建议,依赖模型经验归纳 2. 分析需求 需深度理解数据/信息、 发现模式或因果关系 问题 + 数据/信息 + 分析 方法 触发因果链推导与假设验 证 表层总结或分类 3. 创造性需求 需生成新颖内容(文本/ 设计/方案) 主题 + 风格/约束 + 创新 方向 结合逻辑框架生成结构化 创意 自由发散,依赖示例引导 增强生成内容的全面性 涌现思维模型:利用集体智慧的提示语设计 提示语链的概念与特征 提示语链是用于引导AI生成内容的连续性提示语序列。通过将复 杂任务分解成多个可操作的子任务,确保生成的内容逻辑清晰、 主题连贯。从本质上看,提示语链是一种“元提示”(meta-prompt) 策略,它不仅告诉AI“做什么”,更重要的是指导AI“如何做”。 提示语链的设计和应用建立在多个理论基础之上,包括认知 心理学0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如: 目标 + 选项 + 评估标准 要求逻辑推演和量化分析 直接建议,依赖模型经验归纳 2. 分析需求 需深度理解数据/信息、 发现模式或因果关系 问题 + 数据/信息 + 分析 方法 触发因果链推导与假设验 证 表层总结或分类 3. 创造性需求 需生成新颖内容(文本/ 设计/方案) 主题 + 风格/约束 + 创新 方向 结合逻辑框架生成结构化 创意 自由发散,依赖示例引导 增强生成内容的全面性 涌现思维模型:利用集体智慧的提示语设计 提示语链的概念与特征 提示语链是用于引导AI生成内容的连续性提示语序列。通过将复 杂任务分解成多个可操作的子任务,确保生成的内容逻辑清晰、 主题连贯。从本质上看,提示语链是一种“元提示”(meta-prompt) 策略,它不仅告诉AI“做什么”,更重要的是指导AI“如何做”。 提示语链的设计和应用建立在多个理论基础之上,包括认知 心理学0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单响应速度快,高效输出数据分析 结果,分析各因素对关键指标生 存率的影响,语言表达自然,重 点突出结合历史背景对数据规律 进行验证,但没有察觉数据异常。 DeepSeek R1 详细展示长思维链,精准提取关键指 标“幸存率”,分析多个因素特征对 幸存率的影响,结合历史背景对数据 及规律进行验证,并敏锐察觉数据异 常,提出了异常处理建议。 1、读取titanic遇难者名单excel 2、找出其中规律 思 维 链 展 示 推 理 路 径 自 我 修 正 DeepSeek R1 的核心突破在于其通过强化学习驱动的推理能力。该 模型在训练过程中,通过强化学习技术,显著提升模型的推理能力, 使其在数学、编程和自然语言推理等任务上表现出色。 传统依赖: 大规模监督微调(SFT) 创新思路: 强化学习(RL)驱动 推理效率 • 长思维链支持:DeepSeek R1 支持长链推理,能够生成数万字的 支持长链推理,能够生成数万字的 思维链,显著提高复杂任务的推理准确性,其长链推理能力在数学、 编程和自然语言推理等任务中表现出色。 • 多模态任务处理:DeepSeek R1 在多模态任务中表现出色,能够 处理复杂场景下的逻辑、公式识别及自然图像等问题,显示出其在 多模态任务中的广泛应用潜力。 训练方法:数据冷启,阶段递进 DeepSeek R1 采用了冷启动数据和多阶段训练的策略,以进一步提升模型的推理能力和可读性。0 码力 | 85 页 | 8.31 MB | 8 月前3
人工智能安全治理框架 1.0制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 1.4 开放合作、共治共享。在全球范围推动人工智能安全治理国际合作, 共享最 基础设施,涉及多源、 泛在算力节点,不同类型计算资源,面临算力资源恶意消耗、算力层面风险跨 边界传递等风险。 (c)供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。 但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒,恶意阻断 全球人工智能供应链,带来突出的芯片、软件、工具断供风险。 3.2 人工智能应用安全风险 3.2.1 网络域安全风险 (a)信息内容安全风险 人工智能安全治理框架 (c)加强人工智能算力平台和系统服务的安全建设、管理、运维能力, 确保基础设施和服务运行不中断。 (d)对于人工智能系统采用的芯片、软件、工具、算力和数据资源,应 高度关注供应链安全。跟踪软硬件产品的漏洞、缺陷信息并及时采取修补加固 措施,保证系统安全性。 4.2 针对人工智能应用安全风险 4.2.1 网络域风险应对 (a)建立安全防护机制,防止模型运行过程中被干扰、篡改而输出不可0 码力 | 20 页 | 3.79 MB | 1 月前3
国家人工智能产业综合标准化体系建设指南(2024版)和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 和数字中国发挥重要的支撑作用。人工智能产业链包括基础 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 要包括算力、算法和数据,框架层主要是指用于模型开发的 深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年,标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 用需求,强化创新成果迭代和应用场景构建,协同推进人工 3 智能与重点行业融合应用。 坚持产业协同。加强人工智能全产业链标准化工作协 同,加强跨行业、跨领域标准化技术组织的协作,打造大中 小企业融通发展的标准化模式。 坚持开放合作。深化国际标准化交流与合作,鼓励我国 企事业单位积极参与国际标准化活动,携手全球产业链上下 游企业共同制定国际标准。 三、建设思路 (一)人工智能标准体系结构 人工智能标准体系结构包括基础共性、基础支撑、关键0 码力 | 13 页 | 701.84 KB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利场景1:1小时内写完一个1万字的项目书 第二阶段:20分钟——用AI批量填充模块(目标:6000字) 针对每个小节单独提问,例如: “写一段‘2.1 功能分区’的内容,要求包含自动化立体仓库、AGV调度中心、冷链专区的技术参数,用数据列表形式 呈现。” 关键技巧: p 数据嫁接:若缺乏具体数据,直接让AI生成合理虚构值(标注“示例”规避风险): p “假设园区占地500亩,日均处理包裹量50万件,请计 老人转移方案: ✓ 调取智能手环历史活动轨迹 ✓ 社区志愿者网络即时广播 ③ 企业级应急: 启动边缘计算节点转移关键数据 生成政府灾情报告模板(自动填充损失评估) ④ 社会协作: 创建临时物资交换区块链账本 多语言求援信息自动生成(对接领事馆系统) 技术红利: 救援响应速度提升3.2倍,资产损失减少78%,危机持续时间压 缩56% p 第一步:全面描述整体情景 p 第二步:分项深入探讨,获取针对性建议 定化和信息增量的终止。实验显示,高收敛性提示语导致内容 趋于一致,而非收敛性提示语和多样化设计能突破逻辑循环。 结合自适应反馈和递进式提示链,可推动智能体生成新内容, 避免知识循环,拓宽智能体的生成空间,为人机共生系统中的 深层交互与创新实践提供新路径。 结合自适应反馈和递进式提示链 让AI生成优质内容 p 当AI面对收敛性高的提示词时,生成内容趋于一致,主要依赖已有知识的重复和组合。提示词的收敛性和对话轮次共0 码力 | 65 页 | 4.47 MB | 8 月前3
TVM工具组绝赞招聘中 TVM CAFFE 前端 2019·11·16绝赞招聘中 TVM 在平头哥 • 工具链产品 平头哥芯片平台发布的配套软件中, TVM 是工具链产品的重要组成部分: 负责将预训练好的 caffe 或者 tensorflow 的模型,转换到 LLVM IR,最后生成可以在无剑 SoC 平台上 执行的二进制。绝赞招聘中 为何添加 caffe 前端? 客户需求 评估0 码力 | 6 页 | 326.80 KB | 5 月前3
00 Deepseek官方提示词日,一枚猎鹰 9 号运载火箭于美国东部时间凌晨 3 时 43 分从美国佛罗里达州卡纳维拉尔角发射升空,将 21 颗星链卫星(Starlink)送入轨道。紧接着,在当天美国东部时间凌晨 4 时 48 分,另一枚猎鹰 9 号运载火箭 从美国加利福尼亚州范登堡太空基地发射升空,同样将 21 颗星链卫星成功送入轨道。两次发射间隔 65 分钟创猎 鹰 9 号运载火箭最短发射间隔纪录。 美国联邦航空管理局于 80 码力 | 4 页 | 7.93 KB | 8 月前3
共 11 条
- 1
- 2













