极限编程 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能力的提升，研究者们开 (Fine Tuning) 大模型框架提供基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节大模型训练平台&工具提供了在不同硬件和环境中训练大语言模型所需的基础设施和支持编程语言以 Python 为代表 5 / 32 LLM 基础设施：向量数据库/数据库向量支持向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了架构图 (图源：https://www.geeksforgeeks.org/architecture-of- tensorflow/) 12 / 32 LLM 基础设施：编程语言 LLM 的训练和应用通常使用多种编程语言，取决于任务的需求和团队的偏好。。它的广泛使用得益于其简洁的语法、强大的库支持（如）和深度学习框架（如）。此外，，C++ 有时用于优化计算密集型任务，而

0 码力 | 32 页 | 13.09 MB | 1 年前
3
普通人学AI指南

. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 工具太多，种类太多，老的还没用，新的就出来，头大得很！有没有这种感觉？所以，在这一章，梳理主流的 AI 工具，注意不是穷举，那些不经常用的工具，不浪费文字和耽误时间。梳理总结六大类 AI 工具，分别包括：问答，图像，视频，AI 编程，AI 提示词和 AI 大模型，一共梳理挑选共计 38 个 AI 工具，其中很多都是开源！ 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型，它基于开源：一个开源的视频处理工具，用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎，专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手，集成在 JetBrains 系列开发工具中，提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具，旨在简化数据库操作。

0 码力 | 42 页 | 8.39 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

和办公工具，提升企业竞争力。 • 开源AI教育平台：借助DeepSeek R1 的低成本特性，创建开源AI教育平台，提供免费课程和实验资源，促进AI教育普及。 • 智能编程教育助手：为编程学生提供实时编程指导，自动生成代码示例，帮助解决编程难题。 • 自动化代码审查工具：自动审查代码，发现潜在问题并提供优化建议，提升开发效率与代码质量。新思路：Open AI o3mini的数据应用模型在训练过程中，通过强化学习技术，显著提升模型的推理能力，使其在数学、编程和自然语言推理等任务上表现出色。传统依赖：大规模监督微调（SFT）创新思路：强化学习（RL）驱动  推理效率 • 长思维链支持：DeepSeek R1 支持长链推理，能够生成数万字的思维链，显著提高复杂任务的推理准确性，其长链推理能力在数学、编程和自然语言推理等任务中表现出色。 • 多模态任务处理：DeepSeek OpenAI-o1-1217；在 MATH-500 测试中，取得 97.3%，表现与 OpenAI-o1-1217 相当，远超其他模型。 • 代码生成能力达专家级水平：DeepSeek R1在编程任务中，Elo评分达 2029，超越 96.3% 的人类参赛者；在工程任务中DeepSeek-R1表现略优于 DeepSeek V3，这对开发人员在实际任务中有潜在帮助。  知识类任务表现

0 码力 | 85 页 | 8.31 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

DeepSeek 三种模式对比 • 基础模型（V3）：通用模型（2024.12），高效便捷，适用于绝大多数任务，“ ”任务 • 深度思考（R1）：推理模型，复杂推理和深度分析任务，如数理逻辑推理和编程代码，“ ”任务 • 联网搜索：RAG（检索增强生成），知识库更新至 DeepSeek 两种模型对比操作规范清晰且对结果有明确要求操作路径多元、开放，且对结果没有明确要求 DeepSeek

0 码力 | 35 页 | 9.78 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

基础数据服务标准。规范人工智能研发、测试、应用等过程中涉及数据服务的要求，包括数据采集、数据标注、数据治理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求，包括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接口协议、性能评定、试验方法等技术要求，包括智能传感器的架构、指令、数据格式、信息提取方法、信息融合方法、功能集成

0 码力 | 13 页 | 701.84 KB | 1 年前
3
DeepSeek图解10页PDF

4: Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示基于上面步骤搭建完成后，接下来提问 DeepSeek 一个问题：请帮我分析 Python 编程如何从零开始学习?，下面是它的回答，首先会有一个 think 标签，这里面嵌入的是它的思考过程，不是正式的回复：图 5: deepseek-r1 回复之思考部分等我们看到另一个结束标签 think

0 码力 | 11 页 | 2.64 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

能力创新能力赋能未来产业创意能力赋能企业数转智改数学计算语义理解逻辑推理语言翻译文本创作自动驾驶具身智能 1 2 4 5 知识问答代码编程文本生成多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science

0 码力 | 76 页 | 5.02 MB | 5 月前
3
清华大学普通人如何抓住DeepSeek红利

让AI用类比解释： “请用‘水管流速’比喻说明隐函数求导中dy/dx的意义。” Ø 生成记忆口诀： “把隐函数求导步骤编成顺口溜，包含‘遇y先写 dy/dx’等关键词。” 场景2：文科生快速上手编程加载数据集：使用datasets库加载SQuAD数据集，这个数据集包含了大量基于2020年之前数据生成的问答对。提取问题：从数据集中提取问题，并使用set去重。检查问题数量：确保提取的问题数量至少为10万个。

0 码力 | 65 页 | 4.47 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试 • 错误分析与修复建议 • 代码性能优化提示技术文档处理 • API文档生成 • 代码库解释与示例生成代码生成 • 根据

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试 • 错误分析与修复建议 • 代码性能优化提示技术文档处理 • API文档生成 • 代码库解释与示例生成代码生成 • 根据

0 码力 | 103 页 | 5.40 MB | 8 月前
3

共 10 条前往

页

分类

语言

格式