端到端模型 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek从入门到精通(20250204)

DeepSeek：从入门到精通 @新媒沈阳团队：余梦珑博士后清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 • Deepseek是什么？ • Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作如何从入门到精通？当人人都会用AI时，你如何用得更好更出彩？推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多

0 码力 | 104 页 | 5.37 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学 DeepSeek 从入门到精通

、余梦珑博士后 DeepSeek：从入门到精通 2025年2月清华大学新闻学院人工智能学院 • Deepseek是什么？ • Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • Deep DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成如何使用DeepSeek？网页端：https://chat.deepseek.com APP：DeepSeek 如何从入门到精通？当人人都会用AI时，你如何用得更好更出彩？推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和高吞吐量，适合实时应用。  轻量化设计：模型结构优化，资源占用少，适合边缘设备资源占用少，适合边缘设备和移动端。  多任务支持：支持多种任务，如文本生成、分类和问答。 Kimi k1.5  垂直领域优化：针对特定领域（如医疗、法律）进行优化，提供高精度结果。  长文本处理：擅长处理长文本和复杂文档，适合专业场景。  定制化能力：支持用户自定义训练和微调，适应特定需求。 Open AI o3 mini  小型化设计：轻量级模型，适合资源有限的环境。有包含“春运2025丨X月X日，全社会跨区域人员流动量完成X万人次”的网址进行去重、筛选，合并成网址列表 2.撰写python脚本，基于步骤1输出的网址列表提取所有网址内容“截至目前 2025 年春运（2025年1月14日到2月8日）相关数据（如日期、全社会跨区域人员流动量、铁路客运量、公路人员流动量、水路客运量、民航客运量等）”完成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快，能够高效提

0 码力 | 85 页 | 8.31 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读大模型是真智能，是人工智能的重大拐点。你相不相信？大模型是一场工业革命，将重塑所有产品和业务。你相不相信？不拥抱AI的组织和个人，会被拥抱AI的组织和个人淘汰。你相不相信？建立AI信仰 6政企、创业者必读大模型不是泡沫，而是新一轮工业革命的驱动引擎蒸汽革命电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产力能大模型的进一步突破将引领人类社会进入智能化时代，对我们的生活方式、生产方式带来巨大变革重塑经济图景解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读人工智能发展历程（一）  从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI AI  从擅长理解的认知型AI，发展到擅长文字生成的生成式AI  从语言生成式AI，发展到可理解和生成声音、图片、视频的多模态AI  从生成式AI，发展到推理型AI 专家系统感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读人工智能发展历程（二）  从单纯对话的大模型AI，发展到具有行动和执行能力的智能体AI  从数字空间中的AI，走向能理解和操控物理空间的AI

0 码力 | 76 页 | 5.02 MB | 5 月前
3
普通人学AI指南

Contents 1 AI 大模型基础 4 1.1 AIGC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2 AGI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3 大模型 . . . . . . . . . . . . . . . 12 2.5.6 Snack Prompt . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6 AI 大模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6.1 AgentGPT . . . . . . . . . 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1：安装 Ollama . . . . .

0 码力 | 42 页 | 8.39 MB | 8 月前
3
Deepseek R1 本地部署完全手册

是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册为技术团队提供完整的本地部署指南，涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅案及完整671B MoE模型的Ollama部署⽅法。核⼼提示：个⼈⽤户：不建议部署32B及以上模型，硬件成本极⾼且运维复杂。企业⽤户：需专业团队⽀持，部署前需评估ROI（投资回报率）。⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表模型参数 Windows 20GB - 内存: 32GB（M3 Max） - 存储: 20GB 复杂推理、技术⽂档⽣成 32B+ 企业级部署（需多卡并联）暂不⽀持科研计算、⼤规模数据处理 2. 算⼒需求分析模型参数规模计算精度最低显存需求最低算⼒需求 DeepSeek-R1 (671B) 671B FP8 ≥890GB 2*XE9680（16*H20 GPU） DeepSeek-R1-Distill- NVIDIA）华为昇腾昇腾910B原⽣⽀持R1全系列，提供端到端推理优化⽅案等效A100（FP16）沐曦 GPU MXN系列⽀持70B模型BF16推理，显存利⽤率提升 30% 等效RTX 3090 海光 DCU 适配V3/R1模型，性能对标NVIDIA A100 等效A100（BF16） 2. 国产硬件推荐配置模型参数推荐⽅案适⽤场景 1.5B 太初T100加速卡个⼈开发者原型验证

0 码力 | 7 页 | 932.77 KB | 8 月前
3
DeepSeek-R1使用指南（简版）

DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端 & API 使用指南 DeepSeek-R1 网页端

0 码力 | 25 页 | 5.57 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

• DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。预判领导反应并准备预案（用AI模拟问答） p 操作：输入：“如果领导说‘项目缺了你不行，能不能缩短假期？’如何回应？” p AI建议回应： • 共情+底线+替代方案： “我完全理解项目的重要性，但家人目前手术风险高，必须陪护到周四。我已培训小刘处理核心问题，并随时在线支持（附排班表）。回来后我申请周末加班补进度。场景4：项目中急需请假如何开口最终行动建议： • 快速评估优先级：家庭紧急事件（如生命健康）永远高于工作，无需愧疚。么简单还不会”，不提问又担心后面全听不懂…… 场景1：课堂上突然跟不上了，怎么办 1.课堂当下（隐蔽求助） p 适用场景：课堂上随时快速跟进 p 操作技巧： Ø 在笔记软件中快速标注困惑点（如：“疑问：第二步到第三步如何展开？”） Ø 输入精准问题： “隐函数求导例题：从方程x² + xy + y³ = 0推导 dy/dx，请展示完整的链式法则展开步骤，特别是分母 3y²的来源。” Ø 秒速获取步骤解析：

0 码力 | 65 页 | 4.47 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

DeepSeek如何赋能职场应用？ ——从提示语技巧到多场景应用中央民族大学新闻与传播学院清华大学 @新媒沈阳团队向安玲 Innovator For Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型基座大模型人机协同 Chatbot •自然语言对话 • 致力于人机协同和人机共生领域的世界级团队，专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发 • 何静（清华博士后、北航助理教授）：人机共生之快生引擎研究研发 • 尤可可（清华博士后、北石化助理教授）：人机共生之AIGC短视频 • 安梦瑶（清华大学博士后）：人机共生之AI诊疗研究 • 向安玲（清华博士后、中央民大助理教授）：人机共生之AI数据分析领域 • 马绪峰（清华博士后、同济大学助理教授）：人机共生之文化艺术创作成员及核心研究方向赛事奖项 2024 “AI4S Cup LLM 挑战赛” 大模型科学文献分析赛道一等奖 2024 Kaggl e The Learni ng Agency Lab - PII Data Detecti on 金牌金山办公2024中文文本智能校对大赛第二名

0 码力 | 35 页 | 9.78 MB | 8 月前
3

共 16 条前往

页

分类

语言

格式