eMPP计算引擎 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学第二弹：DeepSeek赋能职场

I、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发 • 何静（清华博士后、北航助理教授）：人机共生之快生引擎研究研发 • 尤可可（清华博士后、北石化助理教授）：人机共生之AIGC短视频 • 安梦瑶（清华大学博士后）：人机共生之AI诊疗研究 • 陶炜（清华大学博士生）：人机共生之AI实时增强技术的探索与实践 2022全球人工智能技术创新大赛-商品标题实体识别一等奖第十八届中国计算语言学大会-小牛杯中文幽默计算一等奖第十届全国社会媒体处理大会-中文隐式情感分析一等奖 2021全球开放数据应用创新大赛-基于文本挖掘的企业隐患排查质量分析模型第一名 2021中国计算机学会大数据与计算智能大赛-“千言〞问题匹配鲁棒性评测第一名 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别第一名互联网虛 (Capability Matrix) •功能范围 •专业技能 •决策权限约束层: 3. 边界系统 (Boundary System) •伦理规范 •安全限制 •资源约束操作层: 4. 工作引擎 (Operation Engine) •输入处理 •执行流程 •输出规范如何使用DeepSeek制作可视化图表？如何使用DeepSeek制作可视化图表？角色: Mermaid图表代码生成器

0 码力 | 35 页 | 9.78 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

确保文献数据的准确性与可信度，为综述内容的真实性提供坚实保障涵盖全球科技论文、专利文献、科学数据、学位论文、预印本、图书专著及开放资源中国知网数据库，涵盖海量的中文文献通过必应搜索引擎收集数据，确保来源的广泛性，但主要依赖互联网主流来源，可能包含推广内容，需进一步筛选和验证文本类型文本更加贴近学术综述，内容涵盖了研究现状、简要评述和主要参考文献，结构完整，生，对模型进行最终的强化学习，以对齐人类偏好。降本提能：架构创新，技术增效 DeepSeek通过架构创新和模型蒸馏技术，在提升模型性能的同时，显著降低计算成本和内存占用。这些技术不仅在长文本处理、代码生成、数学推理等任务中表现出色，还为大模型的轻量化和实际应用提供了有力支持。  模型蒸馏技术 DeepSeek采用模型蒸馏技术，通过将知识从大型复杂模型系列和Llama 系列  架构创新通过将模型划分为多个专家模块，实现高效计算和推理。DeepSeek通过无辅助损失的自然负载均衡和共享专家机制，解决了专家模块工作量不平衡的问题。混合专家（MoE）架构通过低秩压缩减少推理时的内存占用，同时保持与传统多头注意力（MHA）相当的性能。MLA在训练中减少了内存和计算开销，在推理中降低了 KV缓存占用空间。多头潜在注意力（MLA）机制

0 码力 | 85 页 | 8.31 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

业发展、引领产业升级、保障产业安全的支撑作用，更好推进人工智能赋能新型工业化，特制定本指南。一、产业发展现状人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术，正成为发展新质生产力的重要引擎，加速和实体经济深度融合，全面赋能新型工业化，深刻改变工业生产模式和经济发展形态，将对加快建设制造强国、网络强国和数字中国发挥重要的支撑作用。人工智能产业链包括基础层、框架层、模型层、应用层等的人工智能软件开源基础框架，人工智能系统能效评价，人工智能与资 7 源利用、碳排放、废弃部件处置等标准。（二）基础支撑标准基础支撑标准主要包括基础数据服务、智能芯片、智能传感器、计算设备、算力中心、系统软件、开发框架、软硬件协同等标准。 1. 基础数据服务标准。规范人工智能研发、测试、应用等过程中涉及数据服务的要求，包括数据采集、数据标注、数据治理、数据质量等标准。方法、性能指标和评价方法等标准。 4. 计算设备标准。规范人工智能加速卡、人工智能加速模组、人工智能服务器等计算设备，及使能软件的技术要求和测试方法，包括人工智能计算设备虚拟化方法，人工智能加速模组接口协议和测试方法，及使能软件的访问协议、功能、性能、能效的测试方法和运行维护要求等标准。 5. 算力中心标准。规范面向人工智能的大规模计算集群、新型数据中心、智算中心、基础网络通信、算力网络、数据存储

0 码力 | 13 页 | 701.84 KB | 1 年前
3
Deepseek R1 本地部署完全手册

存储: 20GB - 内存: 32GB（M3 Max） - 存储: 20GB 复杂推理、技术⽂档⽣成 32B+ 企业级部署（需多卡并联）暂不⽀持科研计算、⼤规模数据处理 2. 算⼒需求分析模型参数规模计算精度最低显存需求最低算⼒需求 DeepSeek-R1 (671B) 671B FP8 ≥890GB 2*XE9680（16*H20 GPU）国产硬件推荐配置模型参数推荐⽅案适⽤场景 1.5B 太初T100加速卡个⼈开发者原型验证 14B 昆仑芯K200集群企业级复杂任务推理 32B 壁彻算⼒平台+昇腾910B集群科研计算与多模态处理四、云端部署替代⽅案 1. 国内云服务商推荐平台核⼼优势适⽤场景硅基流动官⽅推荐API，低延迟，⽀持多模态模型企业级⾼并发推理腾讯云⼀键部署+限时免费体验，⽀持VPC私有化秘塔搜索：https://metaso.cn 2. 360纳⽶AI搜索：https://www.n.cn/ 3. 硅基流动：https://cloud.siliconflow.cn/i/OBklluwO 4. 字节跳动⽕⼭引擎：https://console.volcengine.com/ark/region:ark+cn-beijing/experience 5. 百度云千帆：https://console.bce.baidu

0 码力 | 7 页 | 932.77 KB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

大模型是一场工业革命，将重塑所有产品和业务。你相不相信？不拥抱AI的组织和个人，会被拥抱AI的组织和个人淘汰。你相不相信？建立AI信仰 6政企、创业者必读大模型不是泡沫，而是新一轮工业革命的驱动引擎蒸汽革命电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产力的关键支撑技术，人工智能+百业千行将带动新一轮工业革命，为高质量发展注入强大动能大模型的进一步突破将引领推理能力难以泛化，成本高昂全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判之二慢思考成为新的发展模式  大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」  大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判之三模型越做越专  除了少数科技巨头，大多数公司都专注于做专业大模型  MoE架构盛行，本质是多个专家模型组成一个大模型 AI安全：实现安全的「自动驾驶」 46政企、创业者必读大模型的六大能力 47 基本能力业务能力创新能力赋能未来产业创意能力赋能企业数转智改数学计算语义理解逻辑推理语言翻译文本创作自动驾驶具身智能 1 2 4 5 知识问答代码编程文本生成多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究

0 码力 | 76 页 | 5.02 MB | 5 月前
3
PAI & TVM Meetup - Shanghai 20191116

计算平台事业部 COMPUTING PLATFORM TensorCore AutocCodeGen and Mixed-Precision Training/Inference PAI (Platform of AD Alibaba Cloud Intelligence Outline 计算平台事业部。TensorCore AutoCodeGen in TVM “。FP16 Mixed-Precision Training on PAI 。INT8 Inference on PAI-Blade 计算平台事业部 COMPUTING PLATFORM TensorCore AutoCodeGen Background 计算平台事业。TensorCore 。A revolutionary technology that delivers groundbreaking AI performance. 。 Performs /mxeo-Drecsion matrix multiply and accumulate in a single operation. Background

0 码力 | 26 页 | 5.82 MB | 5 月前
3
开源中国 2023 大模型(LLM)技术报告

编程  插件、IDE、终端  代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能力的提升，研究者们开始设计更大规模的神经网络，以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展，其预训练和微调的 32 LLM 基础设施：向量数据库/数据库向量支持向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。：大模型开发框架通过提供高层次的 API 简化了复杂模型的构建过程。这些 API 抽象掉了许多底层细节，使开发者能够专注于模型的设计和训练策略。：这些框架经过优化，以充分利用 GPU、TPU 等高性能计算硬件，以加速模型的训练和推理过程。：为了处理大型数据集和大规模参数网络，这些框架通常设计得易于水平扩展，支持在多个处理器或多个服务器上并行处理。：它们提供工具来有效地加载、处理和迭代大型数据集，这对于训练大

0 码力 | 32 页 | 13.09 MB | 1 年前
3
普通人学AI指南

真人转油画：能将真人视频转换成油画风格的 AI 工具。 2.3.9 EBSynth 开源：一个开源的视频处理工具，用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎，专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手，集成在 JetBrains 系列开发工具中，提升编码效率。 9 Figure 6: AI 编程工具

0 码力 | 42 页 | 8.39 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换个性化推荐翻译与转换多语言翻译异常检测专区的技术参数，用数据列表形式呈现。” 关键技巧： p 数据嫁接：若缺乏具体数据，直接让AI生成合理虚构值（标注“示例”规避风险）： p “假设园区占地500亩，日均处理包裹量50万件，请计算自动化分拣设备的配置数量，用表格展示。” p 模板复制：对同类章节（如3.1/3.2/3.3）使用相同指令模板，仅替换关键词。 p 强制格式：要求AI输出带编号小标题、分点、表格的内容，直接粘贴后即显“专业感”。孕妇救援通道： ✓ 自动生成医疗档案二维码 ✓ 无人机勘察可行路线 ✓ 协调民间救援队GPS定位老人转移方案： ✓ 调取智能手环历史活动轨迹 ✓ 社区志愿者网络即时广播 ③ 企业级应急：启动边缘计算节点转移关键数据生成政府灾情报告模板（自动填充损失评估） ④ 社会协作：创建临时物资交换区块链账本多语言求援信息自动生成（对接领事馆系统）技术红利：救援响应速度提升3.2倍，资产损失减少78%，危机持续时间压

0 码力 | 65 页 | 4.47 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成 5. 执行需求需完成具体操作（代码/ 计算/流程）任务 + 步骤约束 + 输出格式自主优化步骤，兼顾效率与正确性严格按指令执行，无自主优化提示语示例决策需求验证性需求 "为降低物流成本，现有两种方案： ①自建区域仓库（初期投入高，长期成本低） ②与第三方合作（按需付费，灵活性高）请根据ROI计算模型，对比5年内的总成本并推荐最优解。" 解。" �实战技巧： "以下是某论文结论：'神经网络模型A优于传统方法B'。请验证： ① 实验数据是否支持该结论； ② 检查对照组设置是否存在偏差； ③ 重新计算p值并判断显著性。" �实战技巧：分析需求 "分析近三年新能源汽车销量数据（附CSV），说明： ① 增长趋势与政策关联性； ② 预测2025年市占率，需使用ARIMA模型并解释参数选择依据。"

0 码力 | 104 页 | 5.37 MB | 8 月前
3

共 14 条前往

页

分类

语言

格式