多集群配置 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Deepseek R1 本地部署完全手册

R1 是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册为技术团队提供完整的本地部署指南，涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅案及完整671B MoE模型的Ollama部署⽅法。核⼼提示：个⼈⽤户：不建议部署32B及以上模型，硬件成本极⾼且运维复杂。企业⽤户：需专业团队⽀持，部署前需评估ROI（投资回报率）。⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表模型参数与硬件对应表模型参数 Windows 配置要求 Mac 配置要求适⽤场景 1.5B - RAM: 4GB - GPU: 集成显卡/现代CPU - 存储: 5GB - 内存: 8GB （M1/M2/M3） - 存储: 5GB 简单⽂本⽣成、基础代码补全 7B - RAM: 8-10GB - GPU: GTX 1680（4-bit量化） - 存储: 8GB - 内存: - GPU: RTX 3090（24GB VRAM） - 存储: 20GB - 内存: 32GB（M3 Max） - 存储: 20GB 复杂推理、技术⽂档⽣成 32B+ 企业级部署（需多卡并联）暂不⽀持科研计算、⼤规模数据处理 2. 算⼒需求分析模型参数规模计算精度最低显存需求最低算⼒需求 DeepSeek-R1 (671B) 671B FP8

0 码力 | 7 页 | 932.77 KB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

将数据转化为统计图、热力图、网络关系图、词云、树形图等，用于揭示数据中蕴含的模式、趋势、异常和洞见。本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek 量信息，请从中读取每一天的信息，并整理成一张表格，要求包括以下几项信息：1.当天日期；2.当天的铁路客运量、比2024年同期多或者少的百分比、环比的百分比。3.当天的公路客运量、比2024年同期多或者少的百分比、环比的百分比。4.当天的民航客运量、比2024年同期多或者少的百分比、环比的百分比。提示词测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响，仅供参考，无法作为决策制定、质量评估或产品验证的最终依据。帮助公众理解复杂的科学和技术知识。 • 复杂数据模式识别：借助o3mini高效分析复杂数据，帮助科学研究和工程领域发现模式和规律，如天文学中的星系演化或地质学中的地震数据分析。 • 多源数据融合分析：在智能交通和城市规划中，o3mini有助于将不同来源的数据（如交通流量、气象数据等）进行融合分析，预测交通拥堵，为城市规划提供决策支持。 • 交互式数据可视化：在商业智能和数据

0 码力 | 85 页 | 8.31 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求，包括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片数据格式和协议等标准。 3. 智能传感器标准。规范单模态、多模态新型传感器的接口协议、性能评定、试验方法等技术要求，包括智能传感器的架构、指令、数据格式、信息提取方法、信息融合方法、功能集成方法、性能指标和评价方法等标准。 4. 计算设备标准。规范人工智能加速卡、人工智能加速模方法，包括人工智能计算设备虚拟化方法，人工智能加速模组接口协议和测试方法，及使能软件的访问协议、功能、性能、能效的测试方法和运行维护要求等标准。 5. 算力中心标准。规范面向人工智能的大规模计算集群、新型数据中心、智算中心、基础网络通信、算力网络、数据存储 8 等基础设施的技术要求和评估方法，包括基础设施参考架构、计算能力评估、技术要求、稳定性要求和业务服务接口等标准。 6. 系人机混合增强智能标准。规范多通道、多模式和多维度的交互途径、模式、方法和技术要求，包括脑机接口、在线知识演化、动态自适应、动态识别、人机协同感知、人机协同决策与控制等标准。 9. 智能体标准。规范以通用大模型为核心的智能体实例和 10 智能体基本功能、应用架构等技术要求，包括智能体强化学习、多任务分解、推理、提示词工程，智能体数据接口和参数范围，人机协作、智能体自主操作、多智能体分布式一致性等标准。

0 码力 | 13 页 | 701.84 KB | 1 年前
3
普通人学AI指南

. . . . . 27 5.2 docker 下载 MaxKB . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.3 docker 配置 MaxKB . . . . . . . . . . . . . . . . . . . . . . . . . 29 5.4 打开 MaxKB 网页 . . . . . . . . . . . . . . . . . . . . 32 5.5 构建第一个私人知识库 . . . . . . . . . . . . . . . . . . . . . . . . 34 5.6 MaxKB 配置本地 llama3 . . . . . . . . . . . . . . . . . . . . . . 37 5.7 创建知识库应用 . . . . . . . . . . . . . . . AI 提示语的工具。 2.5.5 可视化 AI 提示语 Figure 9: 可视化提示词网址：https://tools.saxifrage.xyz/prompt，一个可视化工具，帮助用户为多种 AI 模型生成和优化提示语。 2.5.6 Snack Prompt 提供最新 AI 模型提示词的工具，旨在快速获取和使用最新的 AI 提示进行内容创作。 2.6 AI 大模型 2.6.1

0 码力 | 42 页 | 8.39 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换个性化推荐翻译与转换多语言翻译异常检测多源信息融合知识与推理知识图谱构建流程优化数据可视化数据分析趋势分析多模态交互任务执行任务协调工具调用格式转换关系抽取语言理解文案写作代码注释故事创作通用问答专业领域问答因果推理文本生成与创作建议生成风险评估辅助决策概念关联知识整合交互能力情感分析文本分类图像理解跨模态转换专业建议任务分解情感回应上下文理解对话能力多轮对话数学运算逻辑分析能力图谱诗歌创作语音识别指令理解方案规划实体识别 l 文本创作文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）据列表形式呈现。” 关键技巧： p 数据嫁接：若缺乏具体数据，直接让AI生成合理虚构值（标注“示例”规避风险）： p “假设园区占地500亩，日均处理包裹量50万件，请计算自动化分拣设备的配置数量，用表格展示。” p 模板复制：对同类章节（如3.1/3.2/3.3）使用相同指令模板，仅替换关键词。 p 强制格式：要求AI输出带编号小标题、分点、表格的内容，直接粘贴后即显“专业感”。

0 码力 | 65 页 | 4.47 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型简洁需求，信任模型逻辑 “用Python实现快速排序” 分步指导（如“先写递归函数”）通用模型细化步骤，明确输入输出格式 “先解释快速排序原理，再写出代码并测试示例” 模糊需求（如“写个排序代码”）多轮对话通用模型自然交互，无需结构化指令 “你觉得人工智能的未来会怎样？” 强制逻辑链条（如“分三点回答”）推理模型需明确对话目标，避免开放发散 “从技术、伦理、经济三方面分析 AI的未来” 3. 角色扮演型提示语：要求AI扮演特定角色，模拟特定场景。 4. 创意型提示语：引导AI进行创意写作或内容生成。 5. 分析型提示语：要求AI对给定信息进行分析和推理。 6. 多模态提示语：结合文本、图像等多种形式的输入。表1-1-1提示语的本质特征特征描述示例沟通桥梁连接人类意图和AI理解 “将以下内容翻译为法语：Hello, world” 上下文提供

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型简洁需求，信任模型逻辑 “用Python实现快速排序” 分步指导（如“先写递归函数”）通用模型细化步骤，明确输入输出格式 “先解释快速排序原理，再写出代码并测试示例” 模糊需求（如“写个排序代码”）多轮对话通用模型自然交互，无需结构化指令 “你觉得人工智能的未来会怎样？” 强制逻辑链条（如“分三点回答”）推理模型需明确对话目标，避免开放发散 “从技术、伦理、经济三方面分析 AI的未来” 3. 角色扮演型提示语：要求AI扮演特定角色，模拟特定场景。 4. 创意型提示语：引导AI进行创意写作或内容生成。 5. 分析型提示语：要求AI对给定信息进行分析和推理。 6. 多模态提示语：结合文本、图像等多种形式的输入。表1-1-1提示语的本质特征特征描述示例沟通桥梁连接人类意图和AI理解 “将以下内容翻译为法语：Hello, world” 上下文提供

0 码力 | 103 页 | 5.40 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI  从擅长理解的认知型AI，发展到擅长文字生成的生成式AI  从语言生成式AI，发展到可理解和生成声音、图片、视频的多模态AI  从生成式AI，发展到推理型AI 专家系统感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读人工智能发展历程（二）  从单纯对话的大模型AI，发展到具有行动和执行能力的智能体AI  从数字空 Deepmind的Alpha系列产品是这一趋势的最佳诠释 16政企、创业者必读 DeepSeek出现之前的十大预判之四模型越做越小 17  大模型进入「轻量化」时代，上车上终端，蒸馏小模型  先做得更大，然后探索能做多小政企、创业者必读 DeepSeek出现之前的十大预判之五知识的质量和密度决定大模型能力  高质量数据、合成数据使模型知识密度的快速增长  大模型能以更少的参数量达到更高的性能  36 国外：GPT-4等效智能在过去18个月内价格下降240倍  国内：大模型「亏本」卖，可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判之七多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时，规模正在变小 20政企、创业者必读 21 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力

0 码力 | 76 页 | 5.02 MB | 5 月前
3
人工智能安全治理框架 1.0

的标准接口、特性库和工具包，以及开发界面和执行平台可能存在逻辑缺陷、- 5 - 人工智能安全治理框架漏洞等脆弱点，还可能被恶意植入后门，存在被触发和攻击利用的风险。（b）算力安全风险。人工智能训练运行所依赖的算力基础设施，涉及多源、泛在算力节点，不同类型计算资源，面临算力资源恶意消耗、算力层面风险跨边界传递等风险。（c）供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒，恶意阻断保数据来源清晰、途径合规。建立完善的数据安全管理制度，确保数据安全性和质量，以及合规使用，防范数据泄露、流失、扩散等风险，人工智能产品终止下线时妥善处理用户数据。（c）研发者应确保模型算法训练环境的安全性，包括网络安全配置和数据加密措施等。（d）研发者应评估模型算法潜在偏见，加强训练数据内容和质量的抽查检测，设计有效、可靠的对齐算法，确保价值观风险、伦理风险等可控。（e）研发者应结合目标市场适用法律要求和风险管理要求，评估人工智可控性等，定期进行系统审计，加强风险防范意识与风险应对处置能力。（c）重点领域使用者在使用人工智能产品前，应全面了解其数据处理和隐私保护措施。（d）重点领域使用者应使用高安全级别的密码策略，启用多因素认证机制，增强账户安全性。（e）重点领域使用者应增强网络安全、供应链安全等方面的能力，降低人工智能系统被攻击、重要数据被窃取或泄露的风险，保障业务不中断。（f）重点领域使用者应合

0 码力 | 20 页 | 3.79 MB | 1 月前
3
开源中国 2023 大模型(LLM)技术报告

的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展，其预训练和微调的方法为语言任务提供了前所未有的性能，以此为基础，多模态融合的应用使得 LLM 更全面地处理各种信息，支持更广泛的应用领域。图源：https://postgresml.org/docs/.gitbook/assets/ml_system.svg Web 环境的 LLM 应用。 13 / 32 LLM 基础设施：编程语言 2023 年是大语言模型 (LLM) 之年，Python 作为人工智能领域使用度最高的编程语言，在 2023 年到底有多火？从各种开发者报告、编程语言榜单来看。只要出现有关编程语言流行度的排名，，而 Java、C/C++ 等同样在 LLM 开发中发挥关键作用的语言紧随其后。 14 / 32 LLM 基础设施：编程语言 16 / 32 大模型应用现状：知名大模型在全球范围内，已经发布了多款知名大模型，这些大模型在各个领域都取得了突破性的进展。处理文本数据的 GPT-4，能同时处理和理解多种类型数据的多模态模型 DALL-E 3，以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户，构成了大模型领域的「第一梯队」。讯飞星火 17 / 32 大模型应用现状：首批备案上线的中国大模型

0 码力 | 32 页 | 13.09 MB | 1 年前
3

共 13 条前往

页

分类

语言

格式