中国开源 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

32 LLM Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度，使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。这类工具通常由开源社区支持和维护，提供了灵活、可扩展的工具和库来构建和训练大型机器学习模型，如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow 型在各个领域都取得了突破性的进展。处理文本数据的 GPT-4，能同时处理和理解多种类型数据的多模态模型 DALL-E 3，以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户，构成了大模型领域的「第一梯队」。讯飞星火 17 / 32 大模型应用现状：首批备案上线的中国大模型 8 月 31 日，百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能

0 码力 | 32 页 | 13.09 MB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

发挥举国体制优势，打赢追赶之战 • 大模型带来前所未有安全挑战 • 外挂式传统安全手段难以应对 • 应对模型安全新挑战，打赢未雨绸缪之战 • 大模型是能力而非产品，结合场景才能发挥价值 • 中国拥有最完整的产业链、最全的工业门类、最丰富的场景 • 发挥场景优势，加速传统产业数转智改，打赢弯道超车之战 AGI是全球少数玩家的游戏，政府、企业、创业者更多创新的机会在应用之路 11政企、创业者必读传统软件是辅助人的工具，Agent是能够自主工作的数字员工，是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判之九开源效果追赶上闭源  技术开放，吸引广大开发人员和用户使用  很多公司参与开源，帮助改进产品，众人拾柴火焰高，反哺开源产品，形成正循环政企、创业者必读 DeepSeek出现之前的十大预判之十中美差距快速缩小  美国预训练堆算力的路线不可持续，有待发现新范式“换道超车” 技术上实现对美国的赶超掌握通向AI下一阶段的方法论 DeepSeek颠覆式创新——技术创新  美国人仍在遵循预训练Scaling law范式，走堆显卡路线，如 “星际之门”计划  中国DeepSeek-R1的创新突破，诞生推理型Scaling Law，改写AI发展方向 30政企、创业者必读 DeepSeek在用户体验上实现了三件事  更加理解用户需求，降低Prompt要求

0 码力 | 76 页 | 5.02 MB | 5 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

受众自动生成创意广告文案和宣传语，提高广告创作效率。 • 中小企业AI定制化服务：为中小企业提供定制化的AI解决方案，如智能客服、营销和办公工具，提升企业竞争力。 • 开源AI教育平台：借助DeepSeek R1 的低成本特性，创建开源AI教育平台，提供免费课程和实验资源，促进AI教育普及。 • 智能编程教育助手：为编程学生提供实时编程指导，自动生成代码示例，帮助解决编程难题。 • 自动化代码审查工具：自动审查代码，计撰写的提示词，精准规避AI生成中的幻觉问题。  高规范格式输出：所生成的综述文档格式规范、结构清晰，符合学术论文标准，用户几乎无需进行二次整理。中科院PubScholar平台 “PubScholar”平台是由中国科学院开发的公益学术平台，整合了国内外多种学术资源。该平台提供文献检索、引用分析、文献推荐等功能，用户可通过平台高效获取科研资源，并生成相关的综述报告。平台的优势在于其广泛的数据源和智能化的文和5878万篇专利全文。  无数据检索：以现有真实数据库作为支撑，通过关键词检索，自动搜集相关文献并生成综述报告，支持中、英文检索。知网研学平台 “PubScholar”平台是由中国科学院开发的公益学术平台，整合了国内外多种学术资源。该平台提供文献检索、引用分析、文献推荐等功能，用户可通过平台高效获取科研资源，并生成相关的综述报告。平台的优势在于其广泛的数据源和智能化的

0 码力 | 85 页 | 8.31 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

会发展的持续动力。善用DeepSeek的两大关键：提出问题鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大 (Pass@1) (Pass@1) 国产十免费十开源十强大 Accuracy/Percent le (%) AI https://chat.deepseek.com Z u N e P 6 7 K w S v ，避免情绪化表达。场景4：跨国、跨文化、跨宗教家庭中的继承权冲突背景：你是一位在海外长大的华人，父亲是中国人，母亲是外国人（如美国人），并且家庭成员信仰不同宗教（如父亲是佛教，母亲是基督教）。你有一个年迈的祖父（父亲那边），他在中国有一笔遗产和家族传承。然而，祖父坚持要按照中国传统的家族继承制度来分配遗产，即遗产主要归长子所有，而你是独生女的情况下，可能会面临继承权的争议。具体情

0 码力 | 65 页 | 4.47 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术，正成为发展新质生产力的重要引擎，加速和实体经济深度融合，全面赋能新型工业化，深刻改变工业生产模式和经济发展形态，将对加快建设制造强国、网络强国和数字中国发挥重要的支撑作用。人工智能产业链包括基础层、框架层、模型层、应用层等 4 个部分。其中，基础层主要包括算力、算法和数据，框架层主要是指用于模型开发的深度学习框架和工具，模型层主要是指大模型等技术和产方面实现快速发展，形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代，人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点，亟需完善人工智能产业标准体系。二、总体要求以习近平新时代中国特色社会主义思想为指导，全面贯彻党的二十大和二十届二中全会精神，认真落实中央经济工作会议和全国新型工业化推进大会部署要求，完整、准确、全面贯彻新发展理念，统筹高质量发展和高水平安全，加快组织的管理要求，人工智能管理体系、分类方法、评级流程等标准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法和指标，平衡产业发展与环境保护，包括促进生态可持续的人工智能软件开源基础框架，人工智能系统能效评价，人工智能与资 7 源利用、碳排放、废弃部件处置等标准。（二）基础支撑标准基础支撑标准主要包括基础数据服务、智能芯片、智能传感器、计算设备、算力中心、系统软件、开发框架、软硬件协同等

0 码力 | 13 页 | 701.84 KB | 1 年前
3
DeepSeek从入门到精通(20250204)

Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

话短文本语义匹配一等奖 2022全球人工智能技术创新大赛-商品标题实体识别一等奖第十八届中国计算语言学大会-小牛杯中文幽默计算一等奖第十届全国社会媒体处理大会-中文隐式情感分析一等奖 2021全球开放数据应用创新大赛-基于文本挖掘的企业隐患排查质量分析模型第一名 2021中国计算机学会大数据与计算智能大赛-“千言〞问题匹配鲁棒性评测第一名 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别第一名互联网虛假新闻检测2019全球挑战赛-虛假新闻多模态检测第一名中国法研杯CAIL2020司法人工智能赛第一名 DeepSeek的三种模式平台地址版本备注英伟达NIM微服务 https://build.nvidia.com/d eepseek-ai/deepseek-r1 671B（全量模型）网页版直接使用，支持API调用，注册送1000点数，免费体验。

0 码力 | 35 页 | 9.78 MB | 8 月前
3
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

Formats We present our evaluation formats for each benchmark in Table 12-37, respectively. PROMPT 以下是一道中国高考生物选择题，请选择正确的答案。问题：下列有关高尔基体、线粒体和叶绿体的叙述, 正确的是选项：(A)三者都存在于蓝藻中(B)三者都含有DNA (C)三者都是ATP 合成的场所(D)三者的膜结构中都含有蛋白质 and False or not False is A: Let’s think step by step. Table 14 | An example of BBH. 36 PROMPT 以下是中国关于教育学考试的单项选择题，请选出其中的正确答案。根据我国心理学家冯忠良教授的学习分类，培养学生品德要通过____。 A. 知识的学习 B. 技能的学习 C. 行为规范的学习 D. 态度的学习答案：C

0 码力 | 52 页 | 1.23 MB | 1 年前
3
普通人学AI指南

，能够处理复杂的任务，如自然语言理解、图像识别、语音识别等。闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其高效的学习能力和强大的通用性而受到关注。开源大模型以 Meta 的 Llama 系列，2024 年 4 月，Llama3 发布，包括 8B 和 70B 模型。图 2，时间线主要根据技术论文的发布日期（例如提交至 arXiv 的日期）来确定大型语言模型（大小超过工具，注意不是穷举，那些不经常用的工具，不浪费文字和耽误时间。梳理总结六大类 AI 工具，分别包括：问答，图像，视频，AI 编程，AI 提示词和 AI 大模型，一共梳理挑选共计 38 个 AI 工具，其中很多都是开源！ 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型，它基于 GPT（Generative Pre-trained Transformer） IOPaint 开源：一个用于图像处理的开源工具，可以对图像中的特定物体进行擦除。 2.2.2 无损放大 Upscayl 开源：一个开源软件，专门用于图像的无损放大，通过 AI 增强图像质量。 2.2.3 背景消除 remove.bg 开源：一个流行的开源工具，用于自动从图片中去除背景。 2.2.4 SD (Stable Diffusion) 开源：由 StabilityAI 开发的开源 AI 模型，用于生成高质量的图像。

0 码力 | 42 页 | 8.39 MB | 8 月前
3

共 14 条前往

页

分类

语言

格式