Golang实现 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek从入门到精通(20250204)

CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异 1 2 推理模型通用模型 • 提示语更简洁，只需明确任务目标和需求（因其已内化推理逻辑）。 • 无需逐步指导，模型自动生成结构化推理过程（若强行拆解步骤，反而可通用模型需明确约束目标，避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说，不超过200字” 开放式指令（如“自由创作”）代码生成推理模型简洁需求，信任模型逻辑 “用Python实现快速排序” 分步指导（如“先写递归函数”）通用模型细化步骤，明确输入输出格式 “先解释快速排序原理，再写出代码并测试示例” 模糊需求（如“写个排序代码”）多轮对话通用模型自然交互，无需结构化指令类元素和控制类元素：结构类元素用于定义生成内容的组织形式和呈现方式，决定了AI输出的结构、格式和风格。控制类元素用于管理和引导AI的生成过程，确保输出符合预期并能够进行必要的调整，是实现高级提示语工程的重要工具。提示语的DNA：解构强大提示语的基本元素提示语元素组合矩阵提示语元素协同效应理论的核心观点包括： ▪ 互补增强：某些元素组合可以互相弥补不足，产生1+1>2的效果。

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异 1 2 推理模型通用模型 • 提示语更简洁，只需明确任务目标和需求（因其已内化推理逻辑）。 • 无需逐步指导，模型自动生成结构化推理过程（若强行拆解步骤，反而可通用模型需明确约束目标，避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说，不超过200字” 开放式指令（如“自由创作”）代码生成推理模型简洁需求，信任模型逻辑 “用Python实现快速排序” 分步指导（如“先写递归函数”）通用模型细化步骤，明确输入输出格式 “先解释快速排序原理，再写出代码并测试示例” 模糊需求（如“写个排序代码”）多轮对话通用模型自然交互，无需结构化指令类元素和控制类元素：结构类元素用于定义生成内容的组织形式和呈现方式，决定了AI输出的结构、格式和风格。控制类元素用于管理和引导AI的生成过程，确保输出符合预期并能够进行必要的调整，是实现高级提示语工程的重要工具。提示语的DNA：解构强大提示语的基本元素提示语元素组合矩阵提示语元素协同效应理论的核心观点包括： ▪ 互补增强：某些元素组合可以互相弥补不足，产生1+1>2的效果。

0 码力 | 103 页 | 5.40 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

20政企、创业者必读 21 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力  调用企业专业知识，更懂企业  将日常重复性业务流程形成Playbook，实现流程自动化  通过目标拆解，多次调用大模型以及专家模型协同，形成慢思考能力传统软件是辅助人的工具，Agent是能够自主工作的数字员工，是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判推理能力获得突破的关键是学会了「慢思考」例：课堂提问快问快答  长思维链强大的推理能力是真正人类智力的体现  预训练大模型是人记忆和学习的能力，推理模型是对复杂问题进行规划、分解、预测的能力，实现了真正的慢思考 28 例：课后作业仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律，加速了AGI发展 Alpha Zero时刻 • ChatGPT大模型，通过预训练方式，实现涌现，理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习，但训练复杂推理能力，技术未公开 • DeepSeek-R1 探索出RL方法，且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读技术上实现对美国的赶超掌握通向AI下一阶段的方法论

0 码力 | 76 页 | 5.02 MB | 5 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

对数据进行分类、社交网络分析或时序模式挖掘，常用于客户细分、信用评分、社交媒体营销、股价预测等。将数据转化为统计图、热力图、网络关系图、词云、树形图等，用于揭示数据中蕴含的模式、趋势、异常和洞见。本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。提示词集。三效果如何？元知AI综述工具元知是国内由清华、北航专家团队研发的一个AI学术平台，目前其AI综述生成工具已开放使用，能够帮助用户从海量文献中提取核心信息，通过自然语言处理算法，实现从文献梳理到观点提取到研究评论的一键式全自动生成。产品概况功能亮点功能亮点  多版本与模块化支持：目前提供三个版本（基础版、增强版、专业版），能够灵活应对不同用户的综述需求。工无数据检索：以中国知网数据库作为支撑，通过关键词检索，自动搜集相关文献并生成综述报告，仅支持中文检索。斯坦福STORM 斯坦福STORM平台是由斯坦福大学的oval团队开发的的一款AI科研工具，其核心功能是通过多智能体协作，实现从提纲到段落再到文章的迭代式生成，为用户生成内容大纲及高质量长文本。产品概况功能亮点功能亮点  资料整合与文章生成：能够浏览网络，搜集大量文献，并通过基于主题的多个智能代理，将这些文献转化为连

0 码力 | 85 页 | 8.31 MB | 8 月前
3
普通人学AI指南

tokens 的训练数据，在推理、数学、代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1：安装 Ollama Ollama 可以简单理解为客户端，实现和大模型的交互。ollama 软件 win 和 mac 都包括，如图 11 所示。 13 Figure 11: Ollama 下载在这里已经为大家准备好，只需要在我的微信公众号郭震 AI，回复消息：快速部署：Docker 容器可以在几秒钟内启动，提高了开发和部署的效率。 2. 一致性：确保应用在开发、测试和生产环境中具有一致的运行环境。 3. 可移植性：容器可以在任何支持 Docker 的系统上运行，实现跨平台的可移植性。 4. 易于扩展：Docker 可以方便地扩展并支持微服务架构的部署。基本概念： 1. 容器（Container）：轻量级、独立的可执行软件包，包含了运行所需的代码、运行时、系统工具、系统库和设置。本地知识库优势部署本地知识库，可以借助大模型能力，自动检索我们的工作学习文档，实现对文档内容的实时搜索与问答。因为大模型、知识库和文档全部运行在本地，所以公司内的业务数据不会泄密，个人隐私不会泄密，保证这些同时，让：办公效率直接原地起飞！搭建完成后，实现的效果如图 28： Figure 28: 按照本文教程走完实现的本地知识库效果，大模型 + 个人知识库，太香了！ 5.2 docker

0 码力 | 42 页 | 8.39 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

大模型框架提供基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节大模型训练平台&工具提供了在不同硬件和环境中训练大语言模型所需的基础设施和支持编程语言以 Python 为代表 5 / 32 LLM 基础设施：向量数据库/数据库向量支持向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如等传统数据库均已支持向量检索。 6 / 32 LLM 基础设施：向量数据库/数据库向量支持用较小、特定领域的数据集对模型进行后续训练，以使其更好地适应特定的任务或应用场景。这一步骤使得通用的大型模型能够在特定任务上表现出更高的精度和更好的效果。大模型框架提供了 LLM 的基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节。两者相结合，使得 LLM 在广泛的应用场景中都能发挥出色的性能。 8 / 32 LLM 基础设施：大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点：

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学普通人如何抓住DeepSeek红利

方向，成为社会与个人竞争力的关键。 p 选择中的再创造面对AI提供的多种解法，人类需具备批判性思维与逻辑判断能力，通过选择最优答案，实现解决方案的创新性再生。 p 智慧赋能的决策力提出问题与甄别答案的能力，使人类在信息爆炸与AI辅助的时代，通过决策行为实现价值创造，成为社会发展的持续动力。善用DeepSeek的两大关键：提出问题鉴别答案 DeepSeek是什么? • Dee 需明确约束目标，避免自由发挥 “写一个包含‘量子 ’和‘沙漠 ’ 的短篇小说，不超过200字 ” 开放式指令（如“ 自由创作 ”）代码生成推理模型简洁需求，信任模型逻辑 “用Python实现快速排序 ” 分步指导（如“先写递归函数 ”）通用模型细化步骤，明确输入输出格式 “先解释快速排序原理，再写出代码并测试示例 ” 模糊需求（如“写个排序代码 ”）多轮对话通用模型控制提示语长度的技巧：避免嵌套复杂的指令、保持简洁性、使用分步提示如何实现精准定义：明确的核心问题、具体化的策略一：精准定义任务，减少模糊性生成指令、去除多余信息策略二：适当分解复杂任务，降低AI认知负荷

0 码力 | 65 页 | 4.47 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

参与发明和创造，增强人类的创造力和创新能力 Organization •承担整个组织的功能，独立管理并执行复杂的操作 • 致力于人机协同和人机共生领域的世界级团队，专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发 • 何静（清华博士后、北航助理教授）：人机共生之快生引擎研究研发 • 一款全流程智能化创作工具，专注于将创意构思快速转化为高品质的视频成片。实时生成多达50个分镜脚本，并智能搭配分镜图、视频及音乐提示词，确保创意风格与情感统一。软件支持美学意象风格的短片创作，具备角色一致性技术，离线生成样片，同时实现分镜自动成片功能，全面满足从创意策划到视频制作的高效智能化需求一款基于人机快生理念的AI视频创作系统，从需求提交到成片仅需10分钟，即可输出75分质量的视频。你想要生成什么样的文案？这样的文案具备哪些特征？ 200.00% 250.00% 300.00% 350.00% 杭州深圳成都苏州无锡上海青岛厦门宁波北京大模型A 大模型B 大模型C 大模型D 如何利用DeepSeek实现人机高效协作？基本操作技巧人机协作意识能动意识边界意识

0 码力 | 35 页 | 9.78 MB | 8 月前
3
00 Deepseek官方提示词

射。 6. 代码生成：让模型生成一段完成特定功能的代码。 USER 请帮我用 HTML 生成一个五子棋游戏，所有代码都保存在一个 HTML 中。 7. 代码改写:对代码进行修改，来实现纠错、注释、调优等。 USER 下面这段的代码的效率很低，且没有处理边界情况。请先解释这段代码的问题与解决方法，然后进行优化： ``` def fib(n): if n <= 2:

0 码力 | 4 页 | 7.93 KB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

要包括算力、算法和数据，框架层主要是指用于模型开发的深度学习框架和工具，模型层主要是指大模型等技术和产品，应用层主要是指人工智能技术在行业场景的应用。近年来，我国人工智能产业在技术创新、产品创造和行业应用等方面实现快速发展，形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代，人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点，亟需完善人工智能产业标准体系。二、总体要求

0 码力 | 13 页 | 701.84 KB | 1 年前
3

共 11 条前往

页

分类

语言

格式