开源中国 2023 大模型(LLM)技术报告32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 LLM Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 算力 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。 这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和 库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能0 码力 | 32 页 | 13.09 MB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502发挥举国体制优势,打赢 追赶之战 • 大模型带来前所未有安全 挑战 • 外挂式传统安全手段难以 应对 • 应对模型安全新挑战,打 赢未雨绸缪之战 • 大模型是能力而非产品, 结合场景才能发挥价值 • 中国拥有最完整的产业链、 最全的工业门类、最丰富 的场景 • 发挥场景优势,加速传统 产业数转智改,打赢弯道 超车之战 AGI是全球少数玩家的游戏,政府、企业、创业者更多创新的机会在应用之路 11政企、创业者必读 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 之九 开源效果追赶上闭源 技术开放,吸引广大开发人员和用户使用 很多公司参与开源,帮助改进产品,众人拾柴火焰高, 反哺开源产品,形成正循环政企、创业者必读 DeepSeek出现之前的十大预判 之十 中美差距快速缩小 美国预训练堆算力的路线不可持续,有待发现新范式“换道超车” 技术上实现对美国的赶超 掌握通向AI下一阶段的方法论 DeepSeek颠覆式创新——技术创新 美国人仍在遵循预训练Scaling law范式,走堆显卡路线,如 “星际之门”计划 中国DeepSeek-R1的创新突破,诞生推理型Scaling Law,改 写AI发展方向 30政企、创业者必读 DeepSeek在用户体验上实现了三件事 更加理解用户需求,降低Prompt要求0 码力 | 76 页 | 5.02 MB | 5 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单受众自动生成创意广告文案和宣传语,提高广 告创作效率。 • 中小企业AI定制化服务:为中小企业提 供定制化的AI解决方案,如智能客服、营销 和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek R1 的低成本特性,创建开源AI教育平台,提供 免费课程和实验资源,促进AI教育普及。 • 智能编程教育助手:为编程学生提供实 时编程指导,自动生成代码示例,帮助解决 编程难题。 • 自动化代码审查工具:自动审查代码, 计撰写的提示词,精准规避AI生成中的幻觉问题。 高规范格式输出:所生成的综述文档格式规范、结构清 晰,符合学术论文标准,用户几乎无需进行二次整理。 中科院PubScholar平台 “PubScholar”平台是由中国科学院开发 的公益学术平台,整合了国内外多种学术 资源。该平台提供文献检索、引用分析、 文献推荐等功能,用户可通过平台高效获 取科研资源,并生成相关的综述报告。平 台的优势在于其广泛的数据源和智能化的 文和5878万篇专利全文。 无数据检索:以现有真实数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,支持中、英 文检索。 知网研学平台 “PubScholar”平台是由中国科学院开发 的公益学术平台,整合了国内外多种学术 资源。该平台提供文献检索、引用分析、 文献推荐等功能,用户可通过平台高效获 取科研资源,并生成相关的综述报告。平 台的优势在于其广泛的数据源和智能化的0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 (Pass@1) (Pass@1) 国产 十 免费 十 开源 十 强大 Accuracy/Percent le (%) AI https://chat.deepseek.com Z u N e P 6 7 K w S v ,避免情绪化表达。 场景4:跨国、跨文化、跨宗教家庭中的继承权冲突 背景:你是一位在海外长大的华人,父亲是中国人,母亲是外国人(如美国人),并且家庭成员信仰不同宗教(如父 亲是佛教,母亲是基督教)。你有一个年迈的祖父(父亲那边),他在中国有一笔遗产和家族传承。然而,祖父坚持 要按照中国传统的家族继承制度来分配遗产,即遗产主要归长子所有,而你是独生女的情况下,可能会面临继承权的 争议。 具体情0 码力 | 65 页 | 4.47 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)人工智能是引领新一轮科技革命和产业变革的基础性 和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 和数字中国发挥重要的支撑作用。人工智能产业链包括基础 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 要包括算力、算法和数据,框架层主要是指用于模型开发的 深度学习框架和工具,模型层主要是指大模型等技术和产 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代,人工智能产业呈现出创新技术群体突 破、行业应用融合发展、国际合作深度协同等新特点,亟需 完善人工智能产业标准体系。 二、总体要求 以习近平新时代中国特色社会主义思想为指导,全面贯 彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 组织的管理要求,人工智能管理体系、分类方法、评级流程等标 准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法 和指标,平衡产业发展与环境保护,包括促进生态可持续的人工 智能软件开源基础框架,人工智能系统能效评价,人工智能与资 7 源利用、碳排放、废弃部件处置等标准。 (二)基础支撑标准 基础支撑标准主要包括基础数据服务、智能芯片、智能传感 器、计算设备、算力中心、系统软件、开发框架、软硬件协同等0 码力 | 13 页 | 701.84 KB | 1 年前3
DeepSeek从入门到精通(20250204)Deepseek能够做什么? • 如何使用Deepseek? DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通Deepseek能够做什么? • 如何使用Deepseek? DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场话短文本语义匹配 一等奖 2022全球人工智能技术创新大赛-商品标题实体识别 一等奖 第十八届中国计算语言学大会-小牛杯中文幽默计算 一等奖 第十届全国社会媒体处理大会-中文隐式情感分析 一等奖 2021全球开放数据应用创新大赛-基于文本挖掘的企业隐患排查质量分析模型 第一名 2021中国计算机学会大数据与计算智能大赛-“千言〞 问题匹配鲁棒性评测 第一名 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别 第一名 互联网虛假新闻检测2019全球挑战赛-虛假新闻多模态检测 第一名 中国法研杯CAIL2020司法人工智能赛 第一名 DeepSeek的三种模式 平台 地址 版本 备注 英伟达NIM微服务 https://build.nvidia.com/d eepseek-ai/deepseek-r1 671B(全量模型) 网页版直接使用,支持API调用,注册送1000点数,免费体验。0 码力 | 35 页 | 9.78 MB | 8 月前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language ModelFormats We present our evaluation formats for each benchmark in Table 12-37, respectively. PROMPT 以下是一道中国高考生物选择题,请选择正确的答案。 问题:下列有关高尔基体、线粒体和叶绿体的叙述, 正确的是选项:(A)三者都 存在于蓝藻中(B)三者都含有DNA (C)三者都是ATP 合成的场所(D)三者的膜结 构中都含有蛋白质 and False or not False is A: Let’s think step by step. Table 14 | An example of BBH. 36 PROMPT 以下是中国关于教育学考试的单项选择题,请选出其中的正确答案。 根据我国心理学家冯忠良教授的学习分类,培养学生品德要通过____。 A. 知识的学习 B. 技能的学习 C. 行为规范的学习 D. 态度的学习 答案:C0 码力 | 52 页 | 1.23 MB | 1 年前3
普通人学AI指南,能够处理复杂的任 务,如自然语言理解、图像识别、语音识别等。 闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其 高效的学习能力和强大的通用性而受到关注。 开源大模型以 Meta 的 Llama 系列,2024 年 4 月,Llama3 发布,包括 8B 和 70B 模型。 图 2,时间线主要根据技术论文的发布日期(例如提交至 arXiv 的日期)来 确定大型语言模型(大小超过 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 GPT(Generative Pre-trained Transformer) IOPaint 开源:一个用于图像处理的开源工具,可以对图像中的特定物体进行擦除。 2.2.2 无损放大 Upscayl 开源:一个开源软件,专门用于图像的无损放大,通过 AI 增强图像质量。 2.2.3 背景消除 remove.bg 开源:一个流行的开源工具,用于自动从图片中去除背景。 2.2.4 SD (Stable Diffusion) 开源:由 StabilityAI 开发的开源 AI 模型,用于生成高质量的图像。0 码力 | 42 页 | 8.39 MB | 8 月前3
共 14 条
- 1
- 2













