Web攻击与防护技术 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM 助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM 代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能力的提升，研究者们开始设计更大规模的神经网络，以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展，其预训练和微调的方法为语言任务提供

0 码力 | 32 页 | 13.09 MB | 1 年前
3
人工智能安全治理框架 1.0

全国网络安全标准化技术委员会 2024年9月人工智能安全治理框架1. 人工智能安全治理原则 …………………………………… 1 2. 人工智能安全治理框架构成 ……………………………… 2 3. 人工智能安全风险分类 …………………………………… 3 3.1 人工智能内生安全风险 ……………………………… 3 3.2 人工智能应用安全风险 ……………………………… 5 4. 技术应对措施 ……………………………………………… 和落脚点，构建各方共同参与、技管结合、分工协作的治理机制，压实相关主体安全责任，打造全过程全要素治理链条，培育安全、可靠、公平、透明的人工智能技术研发和应用生态，推动人工智能健康发展和规范应用，切实维护国家主权、安全和发展利益，保障公民、法人和其他组织的合法权益，确保人工智能技术造福于人类。 1.1 包容审慎、确保安全。鼓励发展创新，对人工智能研发及应用采取包容态度。严守安全底线，对危害国家安全、社会公共利益、公众合法权益的 1.2 风险导向、敏捷治理。密切跟踪人工智能研发及应用趋势，从人工智能技术自身、人工智能应用两方面分析梳理安全风险，提出针对性防范应对措施。关注安全风险发展变化，快速动态精准调整治理措施，持续优化治理机制和方式，对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程，综合运用技术、管理相结合的安全治理措施，防范应对不同类型安全风险。围绕人工智能研发

0 码力 | 20 页 | 3.79 MB | 1 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

360集团创始人周鸿祎 3 政企、创业者必读政企、创业者必读一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会  互联网是连接平台，人工智能是生产力  互联网是赋能性技术，生产力属性较弱  人工智能既能单兵作战，也能外部赋能互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读大模型电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产力的关键支撑技术，人工智能+百业千行将带动新一轮工业革命，为高质量发展注入强大动能大模型的进一步突破将引领人类社会进入智能化时代，对我们的生活方式、生产方式带来巨大变革重塑经济图景解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判之二慢思考成为新的发展模式  大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」  大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判之三模型越做越专  除了少数科技巨头，大多数公司都专注于做专业大模型  MoE架构盛行，本质是多个专家模型组成一个大模型  Dee

0 码力 | 76 页 | 5.02 MB | 5 月前
3
DeepSeek从入门到精通(20250204)

团队：余梦珑博士后清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 • Deepseek是什么？ • Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek- 补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）剧本或对话设计文本创作长文本摘要（论文、报告）文本简化（降低复杂度）多语言翻译与本地化摘要与改写 02 03 文本生成自然语言理解与分析知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试 • 错误分析与修复建议 • 代码性

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

• DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成文本简化（降低复杂度）多语言翻译与本地化摘要与改写 02 01 03 文本生成自然语言理解与分析知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试代码调试 • 错误分析与修复建议 • 代码性能优化提示技术文档处理 • API文档生成 • 代码库解释与示例生成代码生成 • 根据需求生成代码片段（Python、 JavaScript） • 自动补全与注释生成常规绘图如何使用DeepSeek？网页端：https://chat.deepseek.com APP：DeepSeek

0 码力 | 103 页 | 5.40 MB | 8 月前
3
普通人学AI指南

1.1 AIGC AIGC 是指使用人工智能模型生成内容的技术。这些内容可以包括图像、音频、文本、视频、3D 模型等。具体来说，AIGC 技术可以生成如下类型的内容： • 图像：如照片、原创艺术作品 • 音频：如视频游戏中的配音、音乐 • 文本：如代码、广告文案、小说 • 3D 模型：如角色、场景目前，AIGC 技术处于早期阶段，最常见的产品形态是基于文本的，通过用户输入来控制所需的内容，然后模型输出与描述相符的内容。下图 1描述了 AI 大模型，AIGC 和 AGI 关系。 Figure 1: AI 大模型，AIGC 和 AGI 关系 4 1.2 AGI AGI（Artificial General Intelligence，人工通用智能）是一种理论上的人工智能，它可以理解、学习和应用知识跨越各种不同领域，功能上等同于人类智能。与专用人工智能（AI）不同，AGI BERT。这些模型因其高效的学习能力和强大的通用性而受到关注。开源大模型以 Meta 的 Llama 系列，2024 年 4 月，Llama3 发布，包括 8B 和 70B 模型。图 2，时间线主要根据技术论文的发布日期（例如提交至 arXiv 的日期）来确定大型语言模型（大小超过 10B）的发展历程。如果没有相应的论文，我们将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开可

0 码力 | 42 页 | 8.39 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

5支持联网查询网址，Claude 3.5 sonnet暂不支持；  四个模型均能根据上传的网页代码，对多个网址链接进行筛选、去重，完全提取出符合指令要求的所有网址链接并形成列表；  在复杂爬虫任务上，DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务，o3响应速度更快，R1数据采集结果更加完整准确；其他2个模型都存在多次调试但代码仍然运行不成功的问题，如代码中罗列URL不全、输出文本中提取数据为空等。很好地完成了数据读取及提取任务，没有漏数据指标，数据逻辑性很好 Kimi k1.5 能够快速读取文件数据，并整理成可视化数据表格，但填入数据有所缺失。  DeepSeek R1与Claude 3.5 sonnet均能很好的完成文件数据读取任务，生成的表格逻辑性强、数据指标清晰，Claude 3.5 sonnet一次性完成表格生成后支持直接复制和表格文件下载。  Open 5相较短文本处理表现更加突出，提取准确的同时数据维度更加全面；由于文本过长DeepSeek R1无法完成任务；  综合来看，Open AI o3mini响应最快效率最高，但在数据集成维度上稍显不足，同时与Claude 3.5 sonnet所输出的表格更为工整、简洁。 Claude 3.5 sonnet 一般文本（7000token）：能够准确提取文本数据，并整理成可视化图表，表格文字简洁，没有提及文本中的

0 码力 | 85 页 | 8.31 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

加快构建满足人工智能产业高质量发展和“人工智能+”高水平赋能需求的标准体系，夯实标准对推动技术进步、促进企业发展、引领产业升级、保障产业安全的支撑作用，更好推进人工智能赋能新型工业化，特制定本指南。一、产业发展现状人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术，正成为发展新质生产力的重要引擎，加速和实体经济深度融合，全面赋能新型工业化，深刻改变工业生要包括算力、算法和数据，框架层主要是指用于模型开发的深度学习框架和工具，模型层主要是指大模型等技术和产品，应用层主要是指人工智能技术在行业场景的应用。近年来，我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展，形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代，人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点，亟需完善人工智能产业标准体系。国人工智能产业高质量发展提供坚实的技术支撑。到 2026 年，标准与产业科技创新的联动水平持续提升，新制定国家标准和行业标准 50 项以上，引领人工智能产业高质量发展的标准体系加快形成。开展标准宣贯和实施推广的企业超过 1000 家，标准服务企业创新发展的成效更加凸显。参与制定国际标准 20 项以上，促进人工智能产业全球化发展。坚持创新驱动。优化产业科技创新与标准化联动机制，加

0 码力 | 13 页 | 701.84 KB | 1 年前
3
清华大学普通人如何抓住DeepSeek红利

清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 @新媒沈阳团队：陶炜博士生普通人如何抓住DeepSeek红利 p Deepseek是什么？ p Deepseek能够做什么？ ——在工作、学习、生活和社会关系中解决问题 p 如何提问？让AI一次性生成你想要的东西卷不动了？DeepSeek帮你一键“躺赢”！学习太难？DeepSeek带你“开挂”逆袭！面对AI提供的多种解法，人类需具备批判性思维与逻辑判断能力，通过选择最优答案，实现解决方案的创新性再生。 p 智慧赋能的决策力提出问题与甄别答案的能力，使人类在信息爆炸与AI辅助的时代，通过决策行为实现价值创造，成为社会发展的持续动力。善用DeepSeek的两大关键：提出问题鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 • • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。 (Pass@1) (Percentile)

0 码力 | 65 页 | 4.47 MB | 8 月前
3
Deepseek R1 本地部署完全手册

是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册为技术团队提供完整的本地部署指南，涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅案及完整671B MoE模型的Ollama部署⽅法。核⼼提示：个⼈⽤户：不建议部署32B及以上模型，硬件成本极⾼且运维复杂。企业⽤户：需专业团队⽀持，部署前需评估ROI（投资回报率）。⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表模型参调试 14B - RAM: 24GB - GPU: RTX 3090（24GB VRAM） - 存储: 20GB - 内存: 32GB（M3 Max） - 存储: 20GB 复杂推理、技术⽂档⽣成 32B+ 企业级部署（需多卡并联）暂不⽀持科研计算、⼤规模数据处理 2. 算⼒需求分析模型参数规模计算精度最低显存需求最低算⼒需求 DeepSeek-R1 FP8 ≥890GB 2*XE9680（16*H20 GPU） DeepSeek-R1-Distill- 70B 70B BF16 ≥180GB 4*L20 或 2*H20 GPU 三、国产芯⽚与硬件适配⽅案 1. 国内⽣态合作伙伴动态企业适配内容性能对标（vs NVIDIA）华为昇腾昇腾910B原⽣⽀持R1全系列，提供端到端推理优化⽅案等效A100（FP16）

0 码力 | 7 页 | 932.77 KB | 8 月前
3

共 22 条前往

页

分类

语言

格式