 开源中国 2023 大模型(LLM)技术报告Agent  备案上线的中国大模型  知名大模型  知名大模型应用 大模型 算力 工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 架构图 (图源:https://www.geeksforgeeks.org/architecture-of- tensorflow/) 12 / 32 LLM 基础设施:编程语言 LLM 的训练和应用通常使用多种编程语言,取决于任务的需求和团 队的偏好。 。它的广泛使用得 益于其简洁的语法、强大的库支持(如 )和深度学习框架(如 )。 此外, ,C++ 有时 用于优化计算密集型任务,而0 码力 | 32 页 | 13.09 MB | 1 年前3 开源中国 2023 大模型(LLM)技术报告Agent  备案上线的中国大模型  知名大模型  知名大模型应用 大模型 算力 工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 架构图 (图源:https://www.geeksforgeeks.org/architecture-of- tensorflow/) 12 / 32 LLM 基础设施:编程语言 LLM 的训练和应用通常使用多种编程语言,取决于任务的需求和团 队的偏好。 。它的广泛使用得 益于其简洁的语法、强大的库支持(如 )和深度学习框架(如 )。 此外, ,C++ 有时 用于优化计算密集型任务,而0 码力 | 32 页 | 13.09 MB | 1 年前3
 普通人学AI指南. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 工具太多,种类太多,老的还没用,新的就出来,头大得 很!有没有这种感觉?所以,在这一章,梳理主流的 AI 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 开源:一个开源的视频处理工具,用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎,专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手,集成在 JetBrains 系列开发工具中,提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。0 码力 | 42 页 | 8.39 MB | 8 月前3 普通人学AI指南. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 工具太多,种类太多,老的还没用,新的就出来,头大得 很!有没有这种感觉?所以,在这一章,梳理主流的 AI 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 开源:一个开源的视频处理工具,用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎,专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手,集成在 JetBrains 系列开发工具中,提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。0 码力 | 42 页 | 8.39 MB | 8 月前3
 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek R1 的低成本特性,创建开源AI教育平台,提供 免费课程和实验资源,促进AI教育普及。 • 智能编程教育助手:为编程学生提供实 时编程指导,自动生成代码示例,帮助解决 编程难题。 • 自动化代码审查工具:自动审查代码, 发现潜在问题并提供优化建议,提升开发效 率与代码质量。 新思路:Open AI o3mini的数据应用 模型在训练过程中,通过强化学习技术,显著提升模型的推理能力, 使其在数学、编程和自然语言推理等任务上表现出色。 传统依赖: 大规模监督微调(SFT) 创新思路: 强化学习(RL)驱动  推理效率 • 长思维链支持:DeepSeek R1 支持长链推理,能够生成数万字的 思维链,显著提高复杂任务的推理准确性,其长链推理能力在数学、 编程和自然语言推理等任务中表现出色。 • 多模态任务处理:DeepSeek OpenAI-o1-1217;在 MATH-500 测试 中,取得 97.3%,表现与 OpenAI-o1-1217 相当,远超其他模型。 • 代码生成能力达专家级水平:DeepSeek R1在编程任务中,Elo评分达 2029,超越 96.3% 的人类参赛者;在工程任务中DeepSeek-R1表现略优 于 DeepSeek V3,这对开发人员在实际任务中有潜在帮助。  知识类任务表现0 码力 | 85 页 | 8.31 MB | 8 月前3 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek R1 的低成本特性,创建开源AI教育平台,提供 免费课程和实验资源,促进AI教育普及。 • 智能编程教育助手:为编程学生提供实 时编程指导,自动生成代码示例,帮助解决 编程难题。 • 自动化代码审查工具:自动审查代码, 发现潜在问题并提供优化建议,提升开发效 率与代码质量。 新思路:Open AI o3mini的数据应用 模型在训练过程中,通过强化学习技术,显著提升模型的推理能力, 使其在数学、编程和自然语言推理等任务上表现出色。 传统依赖: 大规模监督微调(SFT) 创新思路: 强化学习(RL)驱动  推理效率 • 长思维链支持:DeepSeek R1 支持长链推理,能够生成数万字的 思维链,显著提高复杂任务的推理准确性,其长链推理能力在数学、 编程和自然语言推理等任务中表现出色。 • 多模态任务处理:DeepSeek OpenAI-o1-1217;在 MATH-500 测试 中,取得 97.3%,表现与 OpenAI-o1-1217 相当,远超其他模型。 • 代码生成能力达专家级水平:DeepSeek R1在编程任务中,Elo评分达 2029,超越 96.3% 的人类参赛者;在工程任务中DeepSeek-R1表现略优 于 DeepSeek V3,这对开发人员在实际任务中有潜在帮助。  知识类任务表现0 码力 | 85 页 | 8.31 MB | 8 月前3
 清华大学第二弹:DeepSeek赋能职场DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 操作路径多元、开放, 且对结果没有明确要求 DeepSeek0 码力 | 35 页 | 9.78 MB | 8 月前3 清华大学第二弹:DeepSeek赋能职场DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 操作路径多元、开放, 且对结果没有明确要求 DeepSeek0 码力 | 35 页 | 9.78 MB | 8 月前3
 国家人工智能产业综合标准化体系建设指南(2024版)基础数据服务标准。规范人工智能研发、测试、应用等 过程中涉及数据服务的要求,包括数据采集、数据标注、数据治 理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求,包 括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片 数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接 口协议、性能评定、试验方法等技术要求,包括智能传感器的架 构、指令、数据格式、信息提取方法、信息融合方法、功能集成0 码力 | 13 页 | 701.84 KB | 1 年前3 国家人工智能产业综合标准化体系建设指南(2024版)基础数据服务标准。规范人工智能研发、测试、应用等 过程中涉及数据服务的要求,包括数据采集、数据标注、数据治 理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求,包 括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片 数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接 口协议、性能评定、试验方法等技术要求,包括智能传感器的架 构、指令、数据格式、信息提取方法、信息融合方法、功能集成0 码力 | 13 页 | 701.84 KB | 1 年前3
 DeepSeek图解10页PDF4: Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示 基于上面步骤搭建完成后,接下来提问 DeepSeek 一个问题:请帮我分析 Python 编程如何从零开始学习?,下面是它的回答,首先会有一个 think 标签,这里面嵌入的是它的思考过程,不是正式的回复: 图 5: deepseek-r1 回复之思考部分 等我们看到另一个结束标签 think0 码力 | 11 页 | 2.64 MB | 8 月前3 DeepSeek图解10页PDF4: Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示 基于上面步骤搭建完成后,接下来提问 DeepSeek 一个问题:请帮我分析 Python 编程如何从零开始学习?,下面是它的回答,首先会有一个 think 标签,这里面嵌入的是它的思考过程,不是正式的回复: 图 5: deepseek-r1 回复之思考部分 等我们看到另一个结束标签 think0 码力 | 11 页 | 2.64 MB | 8 月前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502能力 创新 能力 赋能 未来产业 创意 能力 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502能力 创新 能力 赋能 未来产业 创意 能力 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science0 码力 | 76 页 | 5.02 MB | 5 月前3
 清华大学 普通人如何抓住DeepSeek红利让AI用类比解释: “请用‘水管流速’比喻说明隐函数求导中dy/dx的意 义。” Ø 生成记忆口诀: “把隐函数求导步骤编成顺口溜,包含‘遇y先写 dy/dx’等关键词。” 场景2:文科生快速上手编程 加载数据集:使用datasets库加载SQuAD数据集,这个数据 集包含了大量基于2020年之前数据生成的问答对。 提取问题:从数据集中提取问题,并使用set去重。 检查问题数量:确保提取的问题数量至少为10万个。0 码力 | 65 页 | 4.47 MB | 8 月前3 清华大学 普通人如何抓住DeepSeek红利让AI用类比解释: “请用‘水管流速’比喻说明隐函数求导中dy/dx的意 义。” Ø 生成记忆口诀: “把隐函数求导步骤编成顺口溜,包含‘遇y先写 dy/dx’等关键词。” 场景2:文科生快速上手编程 加载数据集:使用datasets库加载SQuAD数据集,这个数据 集包含了大量基于2020年之前数据生成的问答对。 提取问题:从数据集中提取问题,并使用set去重。 检查问题数量:确保提取的问题数量至少为10万个。0 码力 | 65 页 | 4.47 MB | 8 月前3
 DeepSeek从入门到精通(20250204)因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据0 码力 | 103 页 | 5.40 MB | 8 月前3
共 10 条
- 1













