大规模机器学习 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM  插件、IDE、终端  代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能力的提升，研究者们开始设计更大规模的神经网络，以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展，其预训练和微调的 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库，使开发者能够更容易地处理大量的数据、管理巨大的网络参数量，并有效地利用硬件资源。微调（Fine Tuning）是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后，微调是用较小、特定领域的数据集对模型进行后续训练，以使其更好

0 码力 | 32 页 | 13.09 MB | 1 年前
3
国家人工智能产业综合标准化体系建设指南（2024版）

产模式和经济发展形态，将对加快建设制造强国、网络强国和数字中国发挥重要的支撑作用。人工智能产业链包括基础层、框架层、模型层、应用层等 4 个部分。其中，基础层主要包括算力、算法和数据，框架层主要是指用于模型开发的深度学习框架和工具，模型层主要是指大模型等技术和产品，应用层主要是指人工智能技术在行业场景的应用。近年来，我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展，形成庞大市场规模。伴随以大模型为代方法，包括人工智能计算设备虚拟化方法，人工智能加速模组接口协议和测试方法，及使能软件的访问协议、功能、性能、能效的测试方法和运行维护要求等标准。 5. 算力中心标准。规范面向人工智能的大规模计算集群、新型数据中心、智算中心、基础网络通信、算力网络、数据存储 8 等基础设施的技术要求和评估方法，包括基础设施参考架构、计算能力评估、技术要求、稳定性要求和业务服务接口等标准。 6 （三）关键技术标准关键技术标准主要包括机器学习、知识图谱、大模型、自然语言处理、智能语音、计算机视觉、生物特征识别、人机混合增强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、模型表达和格式、模型效果评价等，包括自监督学习、无监督学习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共

0 码力 | 13 页 | 701.84 KB | 1 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

推理能力：核心突破，专项升级  推理能力 • 强化学习驱动：DeepSeek R1-Zero 是首个完全基于强化学习（RL）训练的推理模型，无需任何监督微调（SFT）步骤，打破传统模型依赖大量标注数据的惯例。DeepSeek-R1 采用强化学习作为核心训练方法，显著提升了模型的推理能力和语言表达的可读性。 • 推理能力专项提升：在除了利用强化学习模型结合跨领域训练提升模型综合技能以外，展示推理路径自我修正 DeepSeek R1 的核心突破在于其通过强化学习驱动的推理能力。该模型在训练过程中，通过强化学习技术，显著提升模型的推理能力，使其在数学、编程和自然语言推理等任务上表现出色。传统依赖：大规模监督微调（SFT）创新思路：强化学习（RL）驱动  推理效率 • 长思维链支持：DeepSeek R1 支持长链推理，能够生成数万字的点，解决强化学习训练初期的不稳定问题，规范模型的输出格式和推理链条，使其更符合人类可读性。 • 数据来源与特点：这些数据部分来源于清理后的R1-Zero 输出，还包括人工后处理的长思维链（CoT）数据。其数量相对较少但质量高，经过精心设计，具有良好的可读性和结构化特点。 • 对模型训练的影响：冷启动数据为模型训练奠定了坚实的基础，使模型在后续的强化学习阶段能够更稳定地学习和优化。它解

0 码力 | 85 页 | 8.31 MB | 8 月前
3
普通人学AI指南

Intelligence，人工通用智能）是一种理论上的人工智能，它可以理解、学习和应用知识跨越各种不同领域，功能上等同于人类智能。与专用人工智能（AI）不同，AGI 能够执行任何智力任务，具备自我意识和自适应学习能力。AGI 的研发目标是创造出可以广泛地模拟人类认知能力的智能系统。 1.3 大模型大模型通常指的是大规模的人工智能模型，这类模型通过训练大量的数据来获得广泛的知识和能力。这些得广泛的知识和能力。这些模型通常具有庞大的参数数量，能够处理复杂的任务，如自然语言理解、图像识别、语音识别等。闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其高效的学习能力和强大的通用性而受到关注。开源大模型以 Meta 的 Llama 系列，2024 年 4 月，Llama3 发布，包括 8B 和 70B 模型。图 2，时间线主要根据技术论文的发布日期（例如提交至 arXiv 的缩写，表示万亿。在 AI 大模型中，”T” 常用来表示模型在训练中处理的 Token 数量。Token 是指模型处理的基本单元，可以是一个单词、子词，或者字符等。在大规模预训练语言模型的训练中，通常会提到模型是在多少个 Token 上进行学习的，以表明模型的训练规模和数据量。例如：LLaMA3 语言模型使用了超过 15T 个 token 进行训练。 2 AI 工具梳理大家有没有觉得 AI 工

0 码力 | 42 页 | 8.39 MB | 8 月前
3
人工智能安全治理框架 1.0

各环节都面临安全风险，既面临自身技术缺陷、不足带来的风险，也面临不当使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险（a）可解释性差的风险。以深度学习为代表的人工智能算法内部运行逻辑复杂，推理过程属黑灰盒模式，可能导致输出结果难以预测和确切归因，如有异常难以快速修正和溯源追责。（b）偏见、歧视风险。算法设计及训练过程中，个人偏见被有意、无意引入，、无意引入，或者因训练数据集质量问题，导致算法设计目的、输出结果存在偏见或歧视，甚至输出存在民族、宗教、国别、地域等歧视性内容。（c）鲁棒性弱风险。由于深度神经网络存在非线性、大规模等特点，人工智能易受复杂多变运行环境或恶意干扰、诱导的影响，可能带来性能下降、决策错误等诸多问题。- 4 - 人工智能安全治理框架（d）被窃取、篡改的风险。参数、结构、功能等算法核心信息，面临被（b）用于开展认知战的风险。人工智能可被利用于制作传播虚假新闻、- 7 - 人工智能安全治理框架图像、音频、视频等，宣扬恐怖主义、极端主义、有组织犯罪等内容，干涉他国内政、社会制度及社会秩序，危害他国主权；通过社交机器人在网络空间抢占话语权和议程设置权，左右公众价值观和思维认知。 3.2.4 伦理域安全风险（a）加剧社会歧视偏见、扩大智能鸿沟的风险。利用人工智能收集分析人类行为、社会地位、经济状态、个体性格等，对不同人群进行标识分类、区

0 码力 | 20 页 | 3.79 MB | 1 月前
3
DeepSeek图解10页PDF

. . . . . . . . . . . . . . . . 7 2.3.2 监督微调（Supervised Fine-Tuning, SFT） . . . . . . 7 2.3.3 强化学习（Reinforcement Learning, RL） . . . . . . . 7 3 DeepSeek-R1 精华图解 . . . . . . . . . . . . . . . . . R1-Zero 的中间推理模型 . . . . . . . 8 3.1.2 核心创新 2：通用强化学习 . . . . . . . . . . . . . . . 8 3.2 含 R1-Zero 的中间推理模型训练过程 . . . . . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . . . . . . . . . . . . . . 10 Ollama 软件启动 deepseek-r1 界面 1.3 DeepSeek 本地运行使用演示基于上面步骤搭建完成后，接下来提问 DeepSeek 一个问题：请帮我分析 Python 编程如何从零开始学习?，下面是它的回答，首先会有一个 think 标签，这里面嵌入的是它的思考过程，不是正式的回复：图 5: deepseek-r1 回复之思考部分等我们看到另一个结束标签 think 后，表明它的思考已经结束，下面一行

0 码力 | 11 页 | 2.64 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

普通人如何抓住DeepSeek红利 p Deepseek是什么？ p Deepseek能够做什么？ ——在工作、学习、生活和社会关系中解决问题 p 如何提问？让AI一次性生成你想要的东西卷不动了？DeepSeek帮你一键“躺赢”！学习太难？DeepSeek带你“开挂”逆袭！生活太累？DeepSeek帮你“减负”到家！社交障碍？DeepSeek教你“高情商”破局！科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。 (Pass@1) 导致的误解和错误。通过DeepSeek的数据分析功能，新员工可以更深入地理解行业动态和公司运营，做出更明智的决策。成本更低：减少了对培训资源的依赖，新员工可以通过DeepSeek 自主学习，降低培训成本。通过提高工作效率，减少了人力资源的浪费，降低了整体运营成本。场景3：日常客户沟通与问题反馈处理常见问题：与甲方客户的沟通效率低，信息不对称，导致响应不及时或错误场景：

0 码力 | 65 页 | 4.47 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读人工智能发展历程（一）  从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI  从擅长理解的认知型AI，发展到擅长文字生成的生成式AI  从语言生成式AI，发展到可理解和生成声音、图片、视频的多模态AI 认为大模型的能力无法进一步得到质的提升开辟强化学习新范式从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后，继续增大参数规模难以带来质的提升 • 训练算力成本和工程化难度大幅上升强化学习Scaling Law • 利用合成数据解决数据用尽问题利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 • 通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26政企、创业者必读  预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙  预训练模型思考深度不够  算力见顶，变成少数巨头游戏预训练大模型推理大模型

0 码力 | 76 页 | 5.02 MB | 5 月前
3
DeepSeek从入门到精通(20250204)

例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训（1）输入概念： • 社交媒体：即时性、互动性、个性化、病毒传播 • 传统图书馆：知识储备、系统分类、安静学习、专业指导（2）共同特征： • 信息存储和检索 • 用户群体链接 • 知识分享（3）融合点： • 实时知识互动 • 知识深度社交网络 • 数字化图书馆员服务 • 个性化学习路径输入空间定义明确要融合的两个或多个概念领域通用空间识别找出输入空间之间的共同特征选择性投射选择性投射从输入空间选择相关元素进行融合涌现结构构建在融合空间中创造新的、创新结构知识转移技术（KTT）：跨域智慧应用 �KTT的理论基础： KTT基于认知科学中的迁移学习理论和组织学习理论。提出了以下关键步骤： �KTT实施步骤： 1. 定义问题：明确目标领域需要解决的问题或创新点 2. 寻找源域：搜索可能包含相关知识或方法的其他领域 3. 知识提取：从源域提取关键的知识、技能或方法

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训（1）输入概念： • 社交媒体：即时性、互动性、个性化、病毒传播 • 传统图书馆：知识储备、系统分类、安静学习、专业指导（2）共同特征： • 信息存储和检索 • 用户群体链接 • 知识分享（3）融合点： • 实时知识互动 • 知识深度社交网络 • 数字化图书馆员服务 • 个性化学习路径输入空间定义明确要融合的两个或多个概念领域通用空间识别找出输入空间之间的共同特征选择性投射选择性投射从输入空间选择相关元素进行融合涌现结构构建在融合空间中创造新的、创新结构知识转移技术（KTT）：跨域智慧应用 �KTT的理论基础： KTT基于认知科学中的迁移学习理论和组织学习理论。提出了以下关键步骤： �KTT实施步骤： 1. 定义问题：明确目标领域需要解决的问题或创新点 2. 寻找源域：搜索可能包含相关知识或方法的其他领域 3. 知识提取：从源域提取关键的知识、技能或方法

0 码力 | 103 页 | 5.40 MB | 8 月前
3

共 12 条前往

页

分类

语言

格式