威胁模型 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32

0 码力 | 32 页 | 13.09 MB | 1 年前
3
人工智能安全治理框架 1.0

2 针对人工智能应用安全风险 ………………………… 9 5. 综合治理措施 ……………………………………………… 10 6. 人工智能安全开发应用指引 ……………………………… 12 6.1 模型算法研发者安全开发指引 ……………………… 12 6.2 人工智能服务提供者安全指引 ……………………… 13 6.3 重点领域使用者安全应用指引 ……………………… 14 6.4 社会公众安全应用指引制和方式，对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程，综合运用技术、管理相结合的安全治理措施，防范应对不同类型安全风险。围绕人工智能研发应用生态链，明确模型算法研发者、服务提供者、使用者等相关主体的安全责任，有机发挥政府监管、行业自律、社会监督等治理机制作用。 1.4 开放合作、共治共享。在全球范围推动人工智能安全治理国际合作，共享最佳实践，应动态调整更新，需要各方共同对治理框架持续优化完善。 2.1 安全风险方面。通过分析人工智能技术特性，以及在不同行业领域应用场景，梳理人工智能技术本身，及其在应用过程中面临的各种安全风险隐患。 2.2 技术应对措施方面。针对模型算法、训练数据、算力设施、产品服务、应用场景，提出通过安全软件开发、数据质量提升、安全建设运维、测评监测加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性- 3 - 人工智能安全治理框架

0 码力 | 20 页 | 3.79 MB | 1 月前
3
2023 中国开源开发者报告

1 1 /*使用电脑阅读，获得最佳体验 1 1 序毫无疑问，开源开发者圈子来看，2023 年是大模型 LLM 年、生成式 AI GenAI 年。一、这自然要从 OpenAI 说起，前一年年底，ChatGPT 的横空出世，标志着对话式 LLM 开始进入公众视野，为人们提供了全新的人机交互方式。而 2023 年 3 月，同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Google 紧随其后推出 Bard，作为其首次亮相的对话 LLM 产品，无疑具有其里程碑意义，尽管它的首秀并不尽如人意，车翻了又翻。三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索，甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表，它的广大的个人用户和创意行业提供了强有力的工具，彻底改变了数字艺术内容的创作方式。同时，它们也引发了人工智能在创作领域的伦理和法律讨论。LLM 杀进多媒体领域。往后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、语音模型 whisper-3 更新、AI 虚拟主播创造等，都是在这条路上的进一步发展。五、 AI 编程方面，Copilot 可以根据开发者的代码提示自动补全代码，大大

0 码力 | 87 页 | 31.99 MB | 1 年前
3
DeepSeek从入门到精通(20250204)

DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，当人人都会用AI时，你如何用得更好更出彩？推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，当人人都会用AI时，你如何用得更好更出彩？推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

For Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型基座大模型人机协同 Chatbot •自然语言对话 Reasoner •基本的推理和问题解决能力 Agent •代表用户执行任务，具备自主行动能力 Innovator • 参与发明和创造， • 致力于人机协同和人机共生领域的世界级团队，专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发 • 何静（清华博士后、北航助理教授）：人机共生之快生引擎研究研发 • 尤可可（清华博士后、北石化助理教授）：人机共生之AIGC短视频 • 安梦瑶（清华大学博士后）：人机共生之AI诊疗研究 • 向安玲（清华博士后、中央民大助理教授）：人机共生之AI数据分析领域 • 马绪峰（清华博士后、同济大学助理教授）：人机共生之文化艺术创作成员及核心研究方向赛事奖项 2024 “AI4S Cup LLM 挑战赛” 大模型科学文献分析赛道一等奖 2024 Kaggl e The Learni ng Agency Lab - PII Data Detecti on 金牌金山办公2024中文文本智能校对大赛第二名

0 码力 | 35 页 | 9.78 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读大模型是真智能，是人工智能的重大拐点。你相不相信？大模型是一场工业革命，将重塑所有产品和业务。你相不相信？不拥抱AI的组织和个人，会被拥抱AI的组织和个人淘汰。你相不相信？建立AI信仰 6政企、创业者必读大模型不是泡沫，而是新一轮工业革命的驱动引擎蒸汽革命电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产力能大模型的进一步突破将引领人类社会进入智能化时代，对我们的生活方式、生产方式带来巨大变革重塑经济图景解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读人工智能发展历程（一）  从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI 人工智能发展历程（二）  从单纯对话的大模型AI，发展到具有行动和执行能力的智能体AI  从数字空间中的AI，走向能理解和操控物理空间的AI  从解决现实问题的AI，走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读面对全球大模型产业之争，要打赢「三大战役」 AGI之战应用场景之战大模型安全之战 • 探索超越人类的超级人工智能AGI

0 码力 | 76 页 | 5.02 MB | 5 月前
3
2021 中国开源年度报告

increase their talent pool to accelerate product development. 2.2.2 开源软件具有的 Product-Led Growth（PLG）模型特征可以促进付费转化 The Product-Led Growth (PLG) model features of open source software could facilitate Licensing 限制性许可——通过提供一个带有稍带限制的开源许可证来激励使用者进行付费。GPL 和 AGPL 许可，以及新创建的 Commons Clause（被某些 Redis 模块采用）都是这种模型的例子。特别是 AGPL 和 Commons Clause（以及 MongoDB 推出的新 SSPL）也是旨在防御公共云提供商的许可证。这种方法的最大缺点是这些许可证会影响软件采用，通常会流失在项目的早期阶段，供应商创建和管理开发者社区，在欢迎开发者加入成为社区成员的同时保持项目主导地位。个人、团体或企业为解决问题创建软件，并将软件项目代码公开化，这代表着一个开源项目的开始。供应商通过构建沟通渠道、技术平台和治理模型等基础设施来创建开发者社区。在社区创建时，供应商应该向开发者解释清楚项目的管理方式、项目主管、外界可作出哪些贡献、以及项目是否由第三方基金会（如云原生计算基金会-CNCF 和 Apache 软件

0 码力 | 199 页 | 9.63 MB | 1 年前
3
全球开源发展态势洞察（2023年第八期）

Face、微软、英伟达与Stability AI等顶尖人工智能提供商，共同参与对生成式人工智能系统的公开安全评估。 AI Village组织方将这个合作活动描述为“有史以来规模最大的人工智能模型红队演习”。将有数千人参与对公共人工智能模型的评估，期间使用的评估平台由Scale AI负责开发。近日，微软发布了一个补丁，用于修复Secure Boot绕过漏洞。在2023年1月份，微软释出补丁修复了编号为CVE-2022-21894的漏洞，但多的人了解如何开展红队测试和评估人工智能模型，才能解决这些模型中的各种问题。”通过对人工智能模型组开展最大规模的红队演习，AI Village和DEF CON希望能培养出处理人工智能系统漏洞的研究者社区。事实证明，大语言模型的锁定难度远超想象，部分原因在于所谓“提示词注入”技术。人工智能研究员Simon Willison 详细介绍了提示词注入的危险，这种技术可以令语言模型偏离正轨，执行创建者想要回避的操作。在DEF CON大会期间，参与者将通过主办方提供的笔记本电脑定时访问多个大语言模型。并将会有一个夺旗式的积分系统，促进测试各种潜在威胁。积分最高的参与者将获得英伟达高端 GPU作为奖品。AI Village公告中写道，“我们将公布从此次竞赛中得到的启发，帮助其他想要做类似尝试的人们。希望越来越多的人能知晓该如何使用大语言模型，了解这些模型的局限性。” 注释：“红队”测试，是指安全专家尝试在组织系

0 码力 | 22 页 | 1.99 MB | 1 年前
3
2021 中国开源年度报告

的工作地点与模式，提高自身的人才储备来加速产品开发。图表 5 ：开源提高开发人员生产力资料来源：GitHub 2.2.2 开源软件具有的 Product-Led Growth（PLG）模型特征可以促进付费转化 PLG 模式主要通过自下而上的销售模式进行获客，产品是整个销售过程的核心。PLG 模式的增长飞轮有三个主要阶段：获客、转化、留存。在这三个阶段中，开源都有着区别于传统商业模式的优势。资料来源：各公司公告，云启资本 2021 中国开源年度报告 83 未来开源 4.0 时代 Serverless 将成为开源与云计算结合的新模式。无服务器（Serverless）是一种云原生开发模型，可使开发者在无需管理服务器的情况下专注构建和运行应用。无服务器方案将服务器从应用开发中抽离，由云供应商负责置备、维护和扩展服务器基本架构，而开发者则可仅将代码打包到容器中进行部署。Serverless Licensing 限制性许可——通过提供一个带有稍带限制的开源许可证来激励使用者进行付费。GPL 和 AGPL 许可，以及新创建的 Commons Clause（被某些 Redis 模块采用）都是这种模型的例子。特别是 AGPL 和 Commons Clause（以及 MongoDB 推出的新 SSPL）也是旨在防御公共云提供商的许可证。这种方法的最大缺点是这些许可证会影响软件采用，通常会流失潜在用户。尤其是

0 码力 | 132 页 | 14.24 MB | 1 年前
3

共 172 条前往

页

分类

语言

格式

开源中国 2023 大模型(LLM)技术报告

人工智能安全治理框架 1.0

2023 中国开源开发者报告

DeepSeek从入门到精通(20250204)

清华大学 DeepSeek 从入门到精通

清华大学第二弹：DeepSeek赋能职场

【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

2021 中国开源年度报告

全球开源发展态势洞察（2023年第八期）

2021 中国开源年度报告