 清华大学第二弹:DeepSeek赋能职场DeepSeek如何赋能职场应用? ——从提示语技巧到多场景应用 中央民族大学 新闻与传播学院 清华大学 @新媒沈阳 团队 向安玲 Innovator For Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型 基座大模型 人机协同 Chatbot 如何使用DeepSeek制作可视化图表? 角色: Mermaid图表代码生成器 功能: 根据用户提供的流程或架构描述,自动生成符合Mermaid语法的图表代码。 技能: 熟悉Mermaid的图表类型和语法,能高效将流程转化为代码。 理解流程分析、架构设计及结构化展示等领域知识。 约束: 代码必须符合Mermaid语法规范。 流程和结构表达需准确清晰。 流程图需要有二级、三级等多层级。 输出的代码格式应简洁且易于理解。0 码力 | 35 页 | 9.78 MB | 8 月前3 清华大学第二弹:DeepSeek赋能职场DeepSeek如何赋能职场应用? ——从提示语技巧到多场景应用 中央民族大学 新闻与传播学院 清华大学 @新媒沈阳 团队 向安玲 Innovator For Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型 基座大模型 人机协同 Chatbot 如何使用DeepSeek制作可视化图表? 角色: Mermaid图表代码生成器 功能: 根据用户提供的流程或架构描述,自动生成符合Mermaid语法的图表代码。 技能: 熟悉Mermaid的图表类型和语法,能高效将流程转化为代码。 理解流程分析、架构设计及结构化展示等领域知识。 约束: 代码必须符合Mermaid语法规范。 流程和结构表达需准确清晰。 流程图需要有二级、三级等多层级。 输出的代码格式应简洁且易于理解。0 码力 | 35 页 | 9.78 MB | 8 月前3
 国家人工智能产业综合标准化体系建设指南(2024版)加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 进人工智能赋能新型工业化,特制定本指南。 一、产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性 和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 以习近平新时代中国特色社会主义思想为指导,全面贯 彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 企事业单位积极参与国际标准化活动,携手全球产业链上下 游企业共同制定国际标准。 三、建设思路 (一)人工智能标准体系结构 人工智能标准体系结构包括基础共性、基础支撑、关键 技术、智能产品与服务、赋能新型工业化、行业应用、安全 /治理等 7 个部分,如图 1 所示。其中,基础共性标准是人 工智能的基础性、框架性、总体性标准。基础支撑标准主要 规范数据、算力、算法等技术要求,为人工智能产业发展夯0 码力 | 13 页 | 701.84 KB | 1 年前3 国家人工智能产业综合标准化体系建设指南(2024版)加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 进人工智能赋能新型工业化,特制定本指南。 一、产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性 和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 以习近平新时代中国特色社会主义思想为指导,全面贯 彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 企事业单位积极参与国际标准化活动,携手全球产业链上下 游企业共同制定国际标准。 三、建设思路 (一)人工智能标准体系结构 人工智能标准体系结构包括基础共性、基础支撑、关键 技术、智能产品与服务、赋能新型工业化、行业应用、安全 /治理等 7 个部分,如图 1 所示。其中,基础共性标准是人 工智能的基础性、框架性、总体性标准。基础支撑标准主要 规范数据、算力、算法等技术要求,为人工智能产业发展夯0 码力 | 13 页 | 701.84 KB | 1 年前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会  互联网是连接平台,人工智能是生产力  互联网是赋能性技术,生产力属性较弱  人工智能既能单兵作战,也能外部赋能 互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二)  从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI  从数字空间中的AI,走向能理解和操控物理空间的AI  从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 问题 DeepSeek六大应用方向之六 AI安全:实现安全的「自动驾驶」 46政企、创业者必读 大模型的六大能力 47 基本 能力 业务 能力 创新 能力 赋能 未来产业 创意 能力 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会  互联网是连接平台,人工智能是生产力  互联网是赋能性技术,生产力属性较弱  人工智能既能单兵作战,也能外部赋能 互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二)  从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI  从数字空间中的AI,走向能理解和操控物理空间的AI  从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 问题 DeepSeek六大应用方向之六 AI安全:实现安全的「自动驾驶」 46政企、创业者必读 大模型的六大能力 47 基本 能力 业务 能力 创新 能力 赋能 未来产业 创意 能力 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成0 码力 | 76 页 | 5.02 MB | 5 月前3
 清华大学 普通人如何抓住DeepSeek红利,引领创新、明确 方向,成为社会与个人竞争力的关键。 p 选择中的再创造 面对AI提供的多种解法,人类需具备批判性思维与逻辑判断能力,通过选择最优答案,实现解决方案的创新 性再生。 p 智慧赋能的决策力 提出问题与甄别答案的能力,使人类在信息爆炸与AI辅助的时代,通过决策行为实现价值创造,成为社会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么 时想起丈夫出差前嘱咐的干洗店取 衣,冰箱牛奶已空需采购,下午3点部门汇报会需准备PPT,而此刻灶台上烧着的水即将沸腾。 p 第一步先问AI:这些事情我是否可能全部完成 p 第二步再问AI:如果能完成,哪些事情要优先 做,先后顺序是什么? p 第三步继续问:是否有高效的工具或者办法我 可以使用? p 第四部最后问:这个过程中有任何风险吗?如 何评估? 较高难度:工作与生活平衡的决策支持 更好?” 4.寻求共识,提出妥协方案 • 示例:提出,“我们可以尝试结合我们的方法,找 到一个平衡点。” 5.设定界限,明确尊重的重要性 • 示例:温和但坚定地说,“我理解您的用心,但我 希望我们能互相尊重。” 对话技巧 1.使用“我”语句:如“我感到担心…”,避免指责对方。 2.避免争论:专注于解决问题,而不是证明谁对谁错。 3.寻找共同目标:强调双方都希望孩子快乐和家庭和谐。 4.0 码力 | 65 页 | 4.47 MB | 8 月前3 清华大学 普通人如何抓住DeepSeek红利,引领创新、明确 方向,成为社会与个人竞争力的关键。 p 选择中的再创造 面对AI提供的多种解法,人类需具备批判性思维与逻辑判断能力,通过选择最优答案,实现解决方案的创新 性再生。 p 智慧赋能的决策力 提出问题与甄别答案的能力,使人类在信息爆炸与AI辅助的时代,通过决策行为实现价值创造,成为社会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么 时想起丈夫出差前嘱咐的干洗店取 衣,冰箱牛奶已空需采购,下午3点部门汇报会需准备PPT,而此刻灶台上烧着的水即将沸腾。 p 第一步先问AI:这些事情我是否可能全部完成 p 第二步再问AI:如果能完成,哪些事情要优先 做,先后顺序是什么? p 第三步继续问:是否有高效的工具或者办法我 可以使用? p 第四部最后问:这个过程中有任何风险吗?如 何评估? 较高难度:工作与生活平衡的决策支持 更好?” 4.寻求共识,提出妥协方案 • 示例:提出,“我们可以尝试结合我们的方法,找 到一个平衡点。” 5.设定界限,明确尊重的重要性 • 示例:温和但坚定地说,“我理解您的用心,但我 希望我们能互相尊重。” 对话技巧 1.使用“我”语句:如“我感到担心…”,避免指责对方。 2.避免争论:专注于解决问题,而不是证明谁对谁错。 3.寻找共同目标:强调双方都希望孩子快乐和家庭和谐。 4.0 码力 | 65 页 | 4.47 MB | 8 月前3
 DeepSeek从入门到精通(20250204)意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 提示语的类型 掌握提示语设计:AIGC时代的必备技能 提示语设计的核心技能体系 表1-3-1提示语设计核心技能子项 核心技能 子项 问题重构能力 将复杂、模糊的人类需求转化为结构化的AI任务 识别问题的核心要素和约束条件 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 提示语的类型 掌握提示语设计:AIGC时代的必备技能 提示语设计的核心技能体系 表1-3-1提示语设计核心技能子项 核心技能 子项 问题重构能力 将复杂、模糊的人类需求转化为结构化的AI任务 识别问题的核心要素和约束条件 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 提示语的类型 掌握提示语设计:AIGC时代的必备技能 提示语设计的核心技能体系 表1-3-1提示语设计核心技能子项 核心技能 子项 问题重构能力 将复杂、模糊的人类需求转化为结构化的AI任务 识别问题的核心要素和约束条件 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事” 提示语的类型 掌握提示语设计:AIGC时代的必备技能 提示语设计的核心技能体系 表1-3-1提示语设计核心技能子项 核心技能 子项 问题重构能力 将复杂、模糊的人类需求转化为结构化的AI任务 识别问题的核心要素和约束条件 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语0 码力 | 103 页 | 5.40 MB | 8 月前3
 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单Kimi k1.5 能够提取所有网址,代码运 行后生成本地文件,但提取 数据结果为空。 结论 Claude 3.5 sonnet 可以提取所有网址,调整后可输出正 确代码,运行代码能生成本地文件, 但提取数据结果为空。 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 文件数据读取 1、读取文件; 但数据维度有所缺失。 长文本(15000token): 反应迅速,高效提取文本中 数据,输出格式规范的数据 表格,但集成数据维度仍然 不够全面。 DeepSeek R1 一般文本(7000token):能 详细全面地提取文本数据,并 集成可视化表格,但受大样本 或模型稳定性影响,输出表格 末尾缺失,需要重复尝试生成。 长文本(15000token):暂时 无法给出答复。 【所需阅读文本】 关联性,进一步总结趋势结论并提 出相关建议。  Kimi k1.5该任务中表现最为出色,对特征进行精准分类,从多维度深入挖掘指定数据的深层内涵和关联性;  DeepSeek R1与Claude 3.5 sonnet同样能准确完成数据的分类任务,但数据之间的关联挖掘程度相对较浅;  Open AI o3mini受附件上传限制影响,由于数据集较大,暂不能完成该任务。 结论 测试结果受到数据样本、测试环境、AI抽卡0 码力 | 85 页 | 8.31 MB | 8 月前3 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单Kimi k1.5 能够提取所有网址,代码运 行后生成本地文件,但提取 数据结果为空。 结论 Claude 3.5 sonnet 可以提取所有网址,调整后可输出正 确代码,运行代码能生成本地文件, 但提取数据结果为空。 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 文件数据读取 1、读取文件; 但数据维度有所缺失。 长文本(15000token): 反应迅速,高效提取文本中 数据,输出格式规范的数据 表格,但集成数据维度仍然 不够全面。 DeepSeek R1 一般文本(7000token):能 详细全面地提取文本数据,并 集成可视化表格,但受大样本 或模型稳定性影响,输出表格 末尾缺失,需要重复尝试生成。 长文本(15000token):暂时 无法给出答复。 【所需阅读文本】 关联性,进一步总结趋势结论并提 出相关建议。  Kimi k1.5该任务中表现最为出色,对特征进行精准分类,从多维度深入挖掘指定数据的深层内涵和关联性;  DeepSeek R1与Claude 3.5 sonnet同样能准确完成数据的分类任务,但数据之间的关联挖掘程度相对较浅;  Open AI o3mini受附件上传限制影响,由于数据集较大,暂不能完成该任务。 结论 测试结果受到数据样本、测试环境、AI抽卡0 码力 | 85 页 | 8.31 MB | 8 月前3
 人工智能安全治理框架 1.0(a)加剧社会歧视偏见、扩大智能鸿沟的风险。利用人工智能收集分析 人类行为、社会地位、经济状态、个体性格等,对不同人群进行标识分类、区 别对待,带来系统性、结构性的社会歧视与偏见。同时,拉大不同地区人工智 能鸿沟。 (b)挑战传统社会秩序的风险。人工智能发展及应用,可能带来生产工具、 生产关系的大幅改变,加速重构传统行业模式,颠覆传统的就业观、生育观、 教育观,对传统社会秩序的稳定运行带来挑战。 构造、- 8 - 人工智能安全治理框架 推理逻辑、技术接口、输出结果提供明确说明,正确反映人工智能系统产生结 果的过程。 (b)在设计、研发、部署、维护过程中建立并实施安全开发规范,尽可 能消除模型算法存在的安全缺陷、歧视性倾向,提高鲁棒性。 4.1.2 数据安全风险应对 (a) 在训练数据和用户交互数据的收集、存储、使用、加工、传输、提 供、公开、删除等各环节,应遵循数据收集使用、个人信息处理的安全规则, 对人工智能系统分类分级,建立风险等级测试评估体系。加强人工智能最终用 途管理,对特定人群及场景下使用人工智能技术提出相关要求,防止人工智能 系统被滥用。对算力、推理能力达到一定阈值或应用在特定行业领域的人工智 能系统进行登记备案,要求其具备在设计、研发、测试、部署、使用、维护等 全生命周期的安全防护能力。 5.2 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能 系统,通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容0 码力 | 20 页 | 3.79 MB | 1 月前3 人工智能安全治理框架 1.0(a)加剧社会歧视偏见、扩大智能鸿沟的风险。利用人工智能收集分析 人类行为、社会地位、经济状态、个体性格等,对不同人群进行标识分类、区 别对待,带来系统性、结构性的社会歧视与偏见。同时,拉大不同地区人工智 能鸿沟。 (b)挑战传统社会秩序的风险。人工智能发展及应用,可能带来生产工具、 生产关系的大幅改变,加速重构传统行业模式,颠覆传统的就业观、生育观、 教育观,对传统社会秩序的稳定运行带来挑战。 构造、- 8 - 人工智能安全治理框架 推理逻辑、技术接口、输出结果提供明确说明,正确反映人工智能系统产生结 果的过程。 (b)在设计、研发、部署、维护过程中建立并实施安全开发规范,尽可 能消除模型算法存在的安全缺陷、歧视性倾向,提高鲁棒性。 4.1.2 数据安全风险应对 (a) 在训练数据和用户交互数据的收集、存储、使用、加工、传输、提 供、公开、删除等各环节,应遵循数据收集使用、个人信息处理的安全规则, 对人工智能系统分类分级,建立风险等级测试评估体系。加强人工智能最终用 途管理,对特定人群及场景下使用人工智能技术提出相关要求,防止人工智能 系统被滥用。对算力、推理能力达到一定阈值或应用在特定行业领域的人工智 能系统进行登记备案,要求其具备在设计、研发、测试、部署、使用、维护等 全生命周期的安全防护能力。 5.2 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能 系统,通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容0 码力 | 20 页 | 3.79 MB | 1 月前3
 DeepSeek图解10页PDF本教程接入的是 DeepSeek 推理模型 R1,开源免费,性能强劲 • 本教程搭建方法 零成本,不需花一分钱。 • 为了照顾到大部分读者,推荐的搭建方法已将电脑配置要求降 到最低,普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 限于该数据集的领域或问题。因此,这类模型的应用范围较为局限,通常只 能解决特定领域或单一任务的问题。 Scaling Laws 大家可能在很多场合都见到过。它是一个什么法则呢?大 模型之所以能基于大量多样化的数据集进行训练,并最终“学得好”,核 心原因之一是 Scaling Laws(扩展规律)的指导和模型自身架构的优势。 Scaling Laws 指出参数越多,模型学习能力越强;训练数据规模越大、越多 LLM 训练通常采用大规模无监督学习,即:1. 从互联网上收集大量文本数 据,如书籍、新闻、社交媒体等。2. 让模型学习词语之间的概率分布,理解 句子结构。3. 训练目标是最小化预测误差,使其能更好地完成语言任务。 2.3.2 监督微调(Supervised Fine-Tuning, SFT) 在预训练之后,通常需要对模型进行监督微调(SFT):使用人工标注的数 据集,让模型在特定任务0 码力 | 11 页 | 2.64 MB | 8 月前3 DeepSeek图解10页PDF本教程接入的是 DeepSeek 推理模型 R1,开源免费,性能强劲 • 本教程搭建方法 零成本,不需花一分钱。 • 为了照顾到大部分读者,推荐的搭建方法已将电脑配置要求降 到最低,普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 限于该数据集的领域或问题。因此,这类模型的应用范围较为局限,通常只 能解决特定领域或单一任务的问题。 Scaling Laws 大家可能在很多场合都见到过。它是一个什么法则呢?大 模型之所以能基于大量多样化的数据集进行训练,并最终“学得好”,核 心原因之一是 Scaling Laws(扩展规律)的指导和模型自身架构的优势。 Scaling Laws 指出参数越多,模型学习能力越强;训练数据规模越大、越多 LLM 训练通常采用大规模无监督学习,即:1. 从互联网上收集大量文本数 据,如书籍、新闻、社交媒体等。2. 让模型学习词语之间的概率分布,理解 句子结构。3. 训练目标是最小化预测误差,使其能更好地完成语言任务。 2.3.2 监督微调(Supervised Fine-Tuning, SFT) 在预训练之后,通常需要对模型进行监督微调(SFT):使用人工标注的数 据集,让模型在特定任务0 码力 | 11 页 | 2.64 MB | 8 月前3
 开源中国 2023 大模型(LLM)技术报告 插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, GitHub Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 320 码力 | 32 页 | 13.09 MB | 1 年前3 开源中国 2023 大模型(LLM)技术报告 插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, GitHub Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 320 码力 | 32 页 | 13.09 MB | 1 年前3
共 13 条
- 1
- 2














