亿联TVM部署0 码力 | 6 页 | 1.96 MB | 5 月前3
Deepseek R1 本地部署完全手册《Deepseek R1 本地部署完全⼿册》 版权归:HomeBrew Ai Club 作者wechat:samirtan 版本:V2.0 更新⽇期:2025年2⽉8⽇ ⼀、简介 Deepseek R1 是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册 为技术团队提供完整的本地部署指南,涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅ 端替代⽅ 案及完整671B MoE模型的Ollama部署⽅法。 核⼼提示: 个⼈⽤户:不建议部署32B及以上模型,硬件成本极⾼且运维复杂。 企业⽤户:需专业团队⽀持,部署前需评估ROI(投资回报率)。 ⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表 模型参 数 Windows 配置要求 Mac 配置要求 适⽤场景 1.5B - RAM: 4GB - GPU: 集成显卡/现代CPU 24GB - GPU: RTX 3090(24GB VRAM) - 存储: 20GB - 内存: 32GB(M3 Max) - 存储: 20GB 复杂推理、技术⽂档⽣ 成 32B+ 企业级部署(需多卡并联) 暂不⽀持 科研计算、⼤规模数据 处理 2. 算⼒需求分析 模型 参数规 模 计算精 度 最低显存需 求 最低算⼒需求 DeepSeek-R1 (671B) 671B0 码力 | 7 页 | 932.77 KB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502eek-R1 DeepSeek颠覆式创新——开源 33政企、创业者必读 新时代下的集中力量办大事 每个企业都可以直接使用DeepSeek,因为开源透明可信任,企业和 政府可做大量私有化部署 一个开源产品获得突破之后,全世界都能分享成果,结束中国百模大 战,节省大量成本 很多公司参与开源,帮助改进产品,很多人基于DS生态开发应用产 品,增加影响力,人人为我,我为人人 训练成本降低,堆显卡模式受质疑,探索新思路,算法优化空间大 无需训练自己的基座模型,直接部署在DeepSeek上,不用重复发明轮子 公开蒸馏方法,帮助其他模型提升能力,实现了模型制造模型,犹如工业母机 小模型可部署在企业内电脑或一体机上,使用成本降低,形成分布式推理网络 技术门槛降低, 可标准化、SaaS化部署,下载就能用 DeepSeek颠覆式创新——成本暴跌 35政企、创业者必读 惠及全球人民,科技平权,技术平民化 惠及全球人民,科技平权,技术平民化 运营商、云服务可免费用,降低云服务成本 大型企业可使用多个DeepSeek,解决不同场景需求 中小企业免费部署,消除数字鸿沟 个人可以拥有自己的DeepSeek ,可以成为超级个体 对于创业者得到世界最先进大模型,如虎添翼,和巨头站在 同一起跑线上 很多发展中国家都能成为大模型玩家,实现人类命运共同体 DeepSeek颠覆式创新——免费0 码力 | 76 页 | 5.02 MB | 5 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单,这里尽量详细的描述你的数据] 用10张精美的绘图,展示数据变量之间的关系或潜在的分 析思路,包括展示数据分析的直方图和箱线图。 呈现关键变量之间的配对散点矩阵图和小提琴图,以及常 用的相关性热图等,每张图都有详细的解释。 其他常用英文指令 Prompts(指令) 描述 Prompts(指令) 描述 Can you load and preview the data? 加载,预览一下数据 语言支持:支持英文和中文内容 生成。 知网研学平台 界面友好:操作界面简洁明了,用户容易上 手,非技术背景用户也能快速学会使用该工 具进行文献综述的生成。 灵活定制:支持使用本地部署的语言模型, 为有特定需求的用户提供了更多灵活性。 实时演示:提供实时演示demo,方便用户了 解和体验工具的功能。 语言支持:仅支持英文输入和英文内容生成。 斯坦福STORM 生成综述对比:多维度对比 生成综述案例:斯坦福 STORM(英文版) 生成综述案例:斯坦福 STORM(中文译版) ***附加知识*** DeepSeek+DeepResearch 基本知识介绍 DeepSeek:颠覆出圈,霸榜热议 2 0 2 3 年 7 月 D e e p S e e k 成 立 2 0 2 3 年 1 1 月 2 日 首个开源代码大模型 DeepSeek Coder发布 2 0 2 3 年 10 码力 | 85 页 | 8.31 MB | 8 月前3
DeepSeek从入门到精通(20250204)热点筛选:设定热点选择的标准, 如话题热度、受众契合度等 • 角度创新:指导找到差异化的切 入点,避免同质化表达 • 时机把握:明确内容发布的最佳 时间窗口 热点借力内容生成需求: 话题背景:[当前热点] 热度指标:[热搜排名/话题讨论量] 目标受众:[用户群体] 差异化要求: - 分析现有观点角度 - 提出新的切入点 - 设计反直觉表达 传播策略: - 话题标签选择 - 关键意见领袖互动设计 - 评论引导策略 应用示例 提示语设计应突出场景描述 和情绪表达,使内容富有感 染力。 提示语应帮助AI生成节奏明 快、表达简洁的内容,去除 冗余信息,确保信息传递高 效且不失趣味。 节 奏 鲜 明 与 简 洁 高 效 贴 近 热 点 与 用 户 需 求 提示语设计需引导AI关注当 下流行话题,创作具有话题 性和吸引力的内容。 �抖音内容创作的核心原则 1 高度视觉化与短时吸引力 3 强互动性与挑战性 2 情绪饱满与娱乐性0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通热点筛选:设定热点选择的标准, 如话题热度、受众契合度等 • 角度创新:指导找到差异化的切 入点,避免同质化表达 • 时机把握:明确内容发布的最佳 时间窗口 热点借力内容生成需求: 话题背景:[当前热点] 热度指标:[热搜排名/话题讨论量] 目标受众:[用户群体] 差异化要求: - 分析现有观点角度 - 提出新的切入点 - 设计反直觉表达 传播策略: - 话题标签选择 - 关键意见领袖互动设计 - 评论引导策略 应用示例 提示语设计应突出场景描述 和情绪表达,使内容富有感 染力。 提示语应帮助AI生成节奏明 快、表达简洁的内容,去除 冗余信息,确保信息传递高 效且不失趣味。 节 奏 鲜 明 与 简 洁 高 效 贴 近 热 点 与 用 户 需 求 提示语设计需引导AI关注当 下流行话题,创作具有话题 性和吸引力的内容。 �抖音内容创作的核心原则 1 高度视觉化与短时吸引力 3 强互动性与挑战性 2 情绪饱满与娱乐性0 码力 | 103 页 | 5.40 MB | 8 月前3
普通人学AI指南. . . . . . . 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1:安装 Ollama . . . . . 21 4.3 步骤二 docker 部署 lobechat . . . . . . . . . . . . . . . . . . . . . 22 4.4 愉快使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.5 部署常见问题 . . . . . . . . . . . . . Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。 2.4.4 ChatDev 面壁智能开发的 AI 智能体开发平台,支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目,提供零代码网站开发功能,易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器,旨在通过 AI 技术助力快速软件开发。0 码力 | 42 页 | 8.39 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告e-ai-infrastructure- vector-database/) 7 / 32 LLM 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器 学习模型和深度学习模型的软件框架。这些框架提供了 必要的工具和库,使开发者能够更容易地处理大量的数 据、管理巨大的网络参数量,并有效地利用硬件资源。 微调(Fine Tuning)是在大模型框架基础上进行的一个 数据集,这些数据将用于微调模型; 3.微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; 5.部署:将性能经验证的模型部署到实际应用中去。 微调的过程也是分类模型训练的过程 (图源:https://medium.com/mlearning-ai/what-is-a-fine-tuned-llm-67bf0b5df081) 11 / 32 LLM 基础设施:大模型训练平台与工具 大模型训练平台与工具根据其性质不同,可分为以下几类: 这些平台提供了从模型开发到部署的综合解决方案,包括计算资源、 数据存储、模型训练和部署服务。它们通常提供易于使用的界面,支 持快速迭代和大规模部署。Amazon SageMaker、Google Cloud AI Platform 和 Microsoft Azure Machine Learning0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek图解10页PDFPDF 作者:郭震 2025.2.3 目录 1 本地部署并运行 DeepSeek . . . . . . . . . . . . . . . . . . . . . . 2 1.1 为什么要在本地部署 DeepSeek . . . . . . . . . . . . . . . . . 2 1.2 DeepSeek 本地部署三个步骤 . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 1 本地部署并运行 DeepSeek 1.1 为什么要在本地部署 DeepSeek 在本地搭建大模型(如 DeepSeek)具有多个重要的优势,比如: 1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 R1,开源免费,性能强劲 • 本教程搭建方法 零成本,不需花一分钱。 • 为了照顾到大部分读者,推荐的搭建方法已将电脑配置要求降 到最低,普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 一键下载后安装就行,安装过程基本都是下一步。0 码力 | 11 页 | 2.64 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)1 国家人工智能产业综合标准化体系建设指南 (2024版) 为深入贯彻落实党中央、国务院关于加快发展人工智能 的部署要求,贯彻落实《国家标准化发展纲要》《全球人工 智能治理倡议》,进一步加强人工智能标准化工作系统谋划, 加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 特点,亟需 完善人工智能产业标准体系。 二、总体要求 以习近平新时代中国特色社会主义思想为指导,全面贯 彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推 享、管理和应用,包括知识表示与建模、知识获取与存储、知识 融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、 9 知识图谱交付与应用、知识图谱系统架构与性能要求等标准。 3. 大模型标准。规范大模型训练、推理、部署等环节的技 术要求,包括大模型通用技术要求、评测指标与方法、服务能力 成熟度评估、生成内容评价等标准。 4. 自然语言处理标准。规范自然语言处理中语言信息提取、 文本处理、语义处理等方面的技术要求和评测方法,包括语法分0 码力 | 13 页 | 701.84 KB | 1 年前3
共 13 条
- 1
- 2













