 清华大学 普通人如何抓住DeepSeek红利清华大学新闻与传播学院 新媒体研究中心 元宇宙文化实验室 @新媒沈阳 团队 : 陶炜博士生 普通人如何抓住DeepSeek红利 p Deepseek是什么? p Deepseek能够做什么? ——在工作、学习、生活和社会关系中解决问题 p 如何提问?让AI一次性生成你想要的东西 卷不动了?DeepSeek帮你一键“躺赢”! 学习太难?DeepSeek带你“开挂”逆袭! 面对AI提供的多种解法,人类需具备批判性思维与逻辑判断能力,通过选择最优答案,实现解决方案的创新 性再生。 p 智慧赋能的决策力 提出问题与甄别答案的能力,使人类在信息爆炸与AI辅助的时代,通过决策行为实现价值创造,成为社会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测 多源信息融合 知识与推理 知识图谱构建 流程优化 数据可视化 数据分析 趋势分析 多模态交互 任务执行 任务协调 工具调用0 码力 | 65 页 | 4.47 MB | 8 月前3 清华大学 普通人如何抓住DeepSeek红利清华大学新闻与传播学院 新媒体研究中心 元宇宙文化实验室 @新媒沈阳 团队 : 陶炜博士生 普通人如何抓住DeepSeek红利 p Deepseek是什么? p Deepseek能够做什么? ——在工作、学习、生活和社会关系中解决问题 p 如何提问?让AI一次性生成你想要的东西 卷不动了?DeepSeek帮你一键“躺赢”! 学习太难?DeepSeek带你“开挂”逆袭! 面对AI提供的多种解法,人类需具备批判性思维与逻辑判断能力,通过选择最优答案,实现解决方案的创新 性再生。 p 智慧赋能的决策力 提出问题与甄别答案的能力,使人类在信息爆炸与AI辅助的时代,通过决策行为实现价值创造,成为社会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测 多源信息融合 知识与推理 知识图谱构建 流程优化 数据可视化 数据分析 趋势分析 多模态交互 任务执行 任务协调 工具调用0 码力 | 65 页 | 4.47 MB | 8 月前3
 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单5支持联网查询网址,Claude 3.5 sonnet暂不支持;  四个模型均能根据上传的网页代码,对多个网址链接进行筛选、去重,完全提取出符合指令要求的所有网址链接并形成列表;  在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完 整准确;其他2个模型都存在多次调试但代码仍然运行不成功的问题,如代码中罗列URL不全、输出文本中提取数据为空等。 很好地完成了数据读取及提取 任务,没有漏数据指标,数据 逻辑性很好 Kimi k1.5 能够快速读取文件数据,并 整理成可视化数据表格,但 填入数据有所缺失。  DeepSeek R1与Claude 3.5 sonnet均能很好的完成文件数据读取任务,生成的表格逻辑性强、数据指标清晰,Claude 3.5 sonnet一 次性完成表格生成后支持直接复制和表格文件下载。  Open 响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题,没有完整集成到可视化表格中;  长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面;由于文本过长DeepSeek R1无法完成任务;  综合来看,Open AI o3mini响应最快效率最高,但在数据集成维度上稍显不足,同时与Claude 3.5 sonnet所输出的表格更为工整、简洁。0 码力 | 85 页 | 8.31 MB | 8 月前3 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单5支持联网查询网址,Claude 3.5 sonnet暂不支持;  四个模型均能根据上传的网页代码,对多个网址链接进行筛选、去重,完全提取出符合指令要求的所有网址链接并形成列表;  在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完 整准确;其他2个模型都存在多次调试但代码仍然运行不成功的问题,如代码中罗列URL不全、输出文本中提取数据为空等。 很好地完成了数据读取及提取 任务,没有漏数据指标,数据 逻辑性很好 Kimi k1.5 能够快速读取文件数据,并 整理成可视化数据表格,但 填入数据有所缺失。  DeepSeek R1与Claude 3.5 sonnet均能很好的完成文件数据读取任务,生成的表格逻辑性强、数据指标清晰,Claude 3.5 sonnet一 次性完成表格生成后支持直接复制和表格文件下载。  Open 响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题,没有完整集成到可视化表格中;  长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面;由于文本过长DeepSeek R1无法完成任务;  综合来看,Open AI o3mini响应最快效率最高,但在数据集成维度上稍显不足,同时与Claude 3.5 sonnet所输出的表格更为工整、简洁。0 码力 | 85 页 | 8.31 MB | 8 月前3
 DeepSeek从入门到精通(20250204)团队 :余梦珑博士后 清华大学新闻与传播学院 新媒体研究中心 元宇宙文化实验室 • Deepseek是什么? • Deepseek能够做什么? • 如何使用Deepseek? DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek- 补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)团队 :余梦珑博士后 清华大学新闻与传播学院 新媒体研究中心 元宇宙文化实验室 • Deepseek是什么? • Deepseek能够做什么? • 如何使用Deepseek? DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek- 补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通• DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? 网页端:https://chat.deepseek.com APP:DeepSeek0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通• DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? 网页端:https://chat.deepseek.com APP:DeepSeek0 码力 | 103 页 | 5.40 MB | 8 月前3
 人工智能安全治理框架 1.0秉持共同、综合、合作、可持续的安全观,坚持发展和安全并重,以促 进人工智能创新发展为第一要务,以有效防范化解人工智能安全风险为出发点 和落脚点,构建各方共同参与、技管结合、分工协作的治理机制,压实相关主 体安全责任,打造全过程全要素治理链条,培育安全、可靠、公平、透明的人 工智能技术研发和应用生态,推动人工智能健康发展和规范应用,切实维护国 家主权、安全和发展利益,保障公民、法人和其他组织的合法权益,确保人工 智能技术造福于人类。 全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 2.1 安全风险方面。通过分析人工智能技术特性,以及在不同行业领域 应用场景,梳理人工智能技术本身,及其在应用过程中面临的各种安全风险 隐患。 2.2 技术应对措施方面。针对模型算法、训练数据、算力设施、产品服务、 应用场景,提出通过安全软件开发、数据质量提升、安全建设运维、测评监测 加固等技术手段提升0 码力 | 20 页 | 3.79 MB | 1 月前3 人工智能安全治理框架 1.0秉持共同、综合、合作、可持续的安全观,坚持发展和安全并重,以促 进人工智能创新发展为第一要务,以有效防范化解人工智能安全风险为出发点 和落脚点,构建各方共同参与、技管结合、分工协作的治理机制,压实相关主 体安全责任,打造全过程全要素治理链条,培育安全、可靠、公平、透明的人 工智能技术研发和应用生态,推动人工智能健康发展和规范应用,切实维护国 家主权、安全和发展利益,保障公民、法人和其他组织的合法权益,确保人工 智能技术造福于人类。 全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 2.1 安全风险方面。通过分析人工智能技术特性,以及在不同行业领域 应用场景,梳理人工智能技术本身,及其在应用过程中面临的各种安全风险 隐患。 2.2 技术应对措施方面。针对模型算法、训练数据、算力设施、产品服务、 应用场景,提出通过安全软件开发、数据质量提升、安全建设运维、测评监测 加固等技术手段提升0 码力 | 20 页 | 3.79 MB | 1 月前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502降240倍  国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判 之七 多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时,规模正在变小 20政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地  能够调用各种工具,具有行动能力  30政企、创业者必读 DeepSeek在用户体验上实现了三件事  更加理解用户需求,降低Prompt要求  直接呈现思维过程,展现像真人一样思考的能力  可实时联网,把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验 具备强大推理能力,思维过程更加缜密,智能性提升 用起来更像真人,写作能力更强,想象力更丰富 31政企、创业者必读 DeepSeek-R1用户体验改善的作用 49政企、创业者必读 闭源云端通用大模型功能强大 但在政府企业场景中使用存在若干问题  训练知识为网上通用,缺少政府和企业内部知识,不懂业务,无 法解决实际问题  闭源模型云端部署,使用过程中数据外传上网,存在泄密风险  闭源模型规模庞大,无法为企业进行定制,无法本地部署  成本高昂,一般企业难以负担 50政企、创业者必读  不追求用一个大模型解决企业所有问题,而是找垂直场景,做专业技能大模型0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502降240倍  国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判 之七 多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时,规模正在变小 20政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地  能够调用各种工具,具有行动能力  30政企、创业者必读 DeepSeek在用户体验上实现了三件事  更加理解用户需求,降低Prompt要求  直接呈现思维过程,展现像真人一样思考的能力  可实时联网,把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验 具备强大推理能力,思维过程更加缜密,智能性提升 用起来更像真人,写作能力更强,想象力更丰富 31政企、创业者必读 DeepSeek-R1用户体验改善的作用 49政企、创业者必读 闭源云端通用大模型功能强大 但在政府企业场景中使用存在若干问题  训练知识为网上通用,缺少政府和企业内部知识,不懂业务,无 法解决实际问题  闭源模型云端部署,使用过程中数据外传上网,存在泄密风险  闭源模型规模庞大,无法为企业进行定制,无法本地部署  成本高昂,一般企业难以负担 50政企、创业者必读  不追求用一个大模型解决企业所有问题,而是找垂直场景,做专业技能大模型0 码力 | 76 页 | 5.02 MB | 5 月前3
 DeepSeek图解10页PDFDeepSeek-R1 完整训练过程 . . . . . . . . . . . . . . . . . . . 7 3.1.1 核心创新 1:含 R1-Zero 的中间推理模型 . . . . . . . 8 3.1.2 核心创新 2:通用强化学习 . . . . . . . . . . . . . . . 8 3.2 含 R1-Zero 的中间推理模型训练过程 . . . . . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . . . . . . . . . . . . . . 10 3.4 总结 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . . . . DeepSeek 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型(如 DeepSeek)具有多个重要的优势,比如: 1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线0 码力 | 11 页 | 2.64 MB | 8 月前3 DeepSeek图解10页PDFDeepSeek-R1 完整训练过程 . . . . . . . . . . . . . . . . . . . 7 3.1.1 核心创新 1:含 R1-Zero 的中间推理模型 . . . . . . . 8 3.1.2 核心创新 2:通用强化学习 . . . . . . . . . . . . . . . 8 3.2 含 R1-Zero 的中间推理模型训练过程 . . . . . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . . . . . . . . . . . . . . 10 3.4 总结 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . . . . DeepSeek 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型(如 DeepSeek)具有多个重要的优势,比如: 1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线0 码力 | 11 页 | 2.64 MB | 8 月前3
 开源中国 2023 大模型(LLM)技术报告Tuning)  大模型训练平台与工具 基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用 大模型 算力 工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 行过预训练的模型作为起点; 2.准备任务特定数据:收集与目标任务直接相关的 数据集,这些数据将用于微调模型; 3.微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; 5.部署:将性能经验证的模型部署到实际应用中去。 微调的过程也是分类模型训练的过程 (图源:https://medium.com/m0 码力 | 32 页 | 13.09 MB | 1 年前3 开源中国 2023 大模型(LLM)技术报告Tuning)  大模型训练平台与工具 基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用 大模型 算力 工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 行过预训练的模型作为起点; 2.准备任务特定数据:收集与目标任务直接相关的 数据集,这些数据将用于微调模型; 3.微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; 5.部署:将性能经验证的模型部署到实际应用中去。 微调的过程也是分类模型训练的过程 (图源:https://medium.com/m0 码力 | 32 页 | 13.09 MB | 1 年前3
 普通人学AI指南所需的内容,然后模型输出与描 述相符的内容。下图 1描述了 AI 大模型,AIGC 和 AGI 关系。 Figure 1: AI 大模型,AIGC 和 AGI 关系 4 1.2 AGI AGI(Artificial General Intelligence,人工通用智能)是一种理论上的人工智能, 它可以理解、学习和应用知识跨越各种不同领域,功能上等同于人类智能。 与专用人工智能(AI)不同,AGI 开源项目,提供零代码网站开发功能,易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器,旨在通过 AI 技术助力快速软件开发。 2.4.7 Tabby 自托管的 AI 编程助手,开源,支持开发人员优化编码过程。 2.4.8 Codeium 开源的 AI 编程工具,用于自动化代码生成和优化。 2.4.9 GitHub Copilot 由 GitHub 推出的开源 AI 编程助手,能够根据代码库提供编程建议和代码片 首先介绍一种最精简的本地部署大模型的方法。使用目前最强开源大模型 LlaMA3,2024 年 4 月 19 日,Meta 公司发布,共有 8B,70B 两种参数,分 为基础预训练和指令微调两种模型。 与 Llama2 相比,Llama3 使用了 15T tokens 的训练数据,在推理、数学、 代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1:安装 Ollama0 码力 | 42 页 | 8.39 MB | 8 月前3 普通人学AI指南所需的内容,然后模型输出与描 述相符的内容。下图 1描述了 AI 大模型,AIGC 和 AGI 关系。 Figure 1: AI 大模型,AIGC 和 AGI 关系 4 1.2 AGI AGI(Artificial General Intelligence,人工通用智能)是一种理论上的人工智能, 它可以理解、学习和应用知识跨越各种不同领域,功能上等同于人类智能。 与专用人工智能(AI)不同,AGI 开源项目,提供零代码网站开发功能,易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器,旨在通过 AI 技术助力快速软件开发。 2.4.7 Tabby 自托管的 AI 编程助手,开源,支持开发人员优化编码过程。 2.4.8 Codeium 开源的 AI 编程工具,用于自动化代码生成和优化。 2.4.9 GitHub Copilot 由 GitHub 推出的开源 AI 编程助手,能够根据代码库提供编程建议和代码片 首先介绍一种最精简的本地部署大模型的方法。使用目前最强开源大模型 LlaMA3,2024 年 4 月 19 日,Meta 公司发布,共有 8B,70B 两种参数,分 为基础预训练和指令微调两种模型。 与 Llama2 相比,Llama3 使用了 15T tokens 的训练数据,在推理、数学、 代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1:安装 Ollama0 码力 | 42 页 | 8.39 MB | 8 月前3
 国家人工智能产业综合标准化体系建设指南(2024版)国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年,标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 50 项以上,引领人工智能产业 高质量发展的标准体系加快形成。开展标准宣贯和实施推广 的企业超过 1000 家,标准服务企业创新发展的成效更加凸 显。参与制定国际标准 20 项以上,促进人工智能产业全球 化发展。 坚持创新驱动。优化产业科技创新与标准化联动机制, 加快人工智能领域关键共性技术研究,推动先进适用的科技 同,加强跨行业、跨领域标准化技术组织的协作,打造大中 小企业融通发展的标准化模式。 坚持开放合作。深化国际标准化交流与合作,鼓励我国 企事业单位积极参与国际标准化活动,携手全球产业链上下 游企业共同制定国际标准。 三、建设思路 (一)人工智能标准体系结构 人工智能标准体系结构包括基础共性、基础支撑、关键 技术、智能产品与服务、赋能新型工业化、行业应用、安全 /治理等 7 个部分,如图 1 所示。其中,基础共性标准是人 规范数据、算力、算法等技术要求,为人工智能产业发展夯 实技术底座。关键技术标准主要规范人工智能文本、语音、 图像,以及人机混合增强智能、智能体、跨媒体智能、具身 智能等的技术要求,推动人工智能技术创新和应用。智能产 品与服务标准主要规范由人工智能技术形成的智能产品和 服务模式。赋能新型工业化标准主要规范人工智能技术赋能 制造业全流程智能化以及重点行业智能升级的技术要求。行 业应用标准主要规范人工智能赋能各行业的技术要求,为人0 码力 | 13 页 | 701.84 KB | 1 年前3 国家人工智能产业综合标准化体系建设指南(2024版)国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年,标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 50 项以上,引领人工智能产业 高质量发展的标准体系加快形成。开展标准宣贯和实施推广 的企业超过 1000 家,标准服务企业创新发展的成效更加凸 显。参与制定国际标准 20 项以上,促进人工智能产业全球 化发展。 坚持创新驱动。优化产业科技创新与标准化联动机制, 加快人工智能领域关键共性技术研究,推动先进适用的科技 同,加强跨行业、跨领域标准化技术组织的协作,打造大中 小企业融通发展的标准化模式。 坚持开放合作。深化国际标准化交流与合作,鼓励我国 企事业单位积极参与国际标准化活动,携手全球产业链上下 游企业共同制定国际标准。 三、建设思路 (一)人工智能标准体系结构 人工智能标准体系结构包括基础共性、基础支撑、关键 技术、智能产品与服务、赋能新型工业化、行业应用、安全 /治理等 7 个部分,如图 1 所示。其中,基础共性标准是人 规范数据、算力、算法等技术要求,为人工智能产业发展夯 实技术底座。关键技术标准主要规范人工智能文本、语音、 图像,以及人机混合增强智能、智能体、跨媒体智能、具身 智能等的技术要求,推动人工智能技术创新和应用。智能产 品与服务标准主要规范由人工智能技术形成的智能产品和 服务模式。赋能新型工业化标准主要规范人工智能技术赋能 制造业全流程智能化以及重点行业智能升级的技术要求。行 业应用标准主要规范人工智能赋能各行业的技术要求,为人0 码力 | 13 页 | 701.84 KB | 1 年前3
共 14 条
- 1
- 2














