DeepSeek从入门到精通(20250204)CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成 推理模型 简洁需求,信任模型逻辑 “用Python实现快速排序” 分步指导(如“先写递归函数”) 通用模型 细化步骤,明确输入输出格式 “先解释快速排序原理,再写出代 码并测试示例” 模糊需求(如“写个排序代码”) 多轮对话 通用模型 自然交互,无需结构化指令 类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合预期并能够进行必要的调整,是实现高级提示语 工程的重要工具。 提示语的DNA:解构强大提示语的基本元素 提示语元素组合矩阵 提示语元素协同效应理论的核心观点包括: ▪ 互补增强:某些元素组合可以互相弥补不足,产生1+1>2的效果。0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成 推理模型 简洁需求,信任模型逻辑 “用Python实现快速排序” 分步指导(如“先写递归函数”) 通用模型 细化步骤,明确输入输出格式 “先解释快速排序原理,再写出代 码并测试示例” 模糊需求(如“写个排序代码”) 多轮对话 通用模型 自然交互,无需结构化指令 类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合预期并能够进行必要的调整,是实现高级提示语 工程的重要工具。 提示语的DNA:解构强大提示语的基本元素 提示语元素组合矩阵 提示语元素协同效应理论的核心观点包括: ▪ 互补增强:某些元素组合可以互相弥补不足,产生1+1>2的效果。0 码力 | 103 页 | 5.40 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-20250220政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地 能够调用各种工具,具有行动能力 调用企业专业知识,更懂企业 将日常重复性业务流程形成Playbook,实现流程自动化 通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 推理能力获得突破的关键是学会了「慢思考」 例:课堂提问 快问快答 长思维链强大的推理能力是真正人类智力的体现 预训练大模型是人记忆和学习的能力,推理模型是对复杂问题 进行规划、分解、预测的能力,实现了真正的慢思考 28 例:课后作业 仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律,加速了AGI发展 Alpha Zero时刻 • ChatGPT大模型, 通过预训练方式,实现涌 现,理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习,但训练复 杂推理能力,技术未公开 • DeepSeek-R1 探索出RL方 法,且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读 技术上实现对美国的赶超 掌握通向AI下一阶段的方法论0 码力 | 76 页 | 5.02 MB | 5 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 提示词集。 三 效果如何? 元知AI综述工具 元知是国内由清华、北航专家团队研发的一个AI学术平台,目前其AI综述生成工具已开放使用,能够帮助用户从海 量文献中提取核心信息,通过自然语言处理算法,实现从文献梳理到观点提取到研究评论的一键式全自动生成。 产品 概况 功能亮点 功能亮点 多版本与模块化支持:目前提供三个版本(基础版、增 强版、专业版),能够灵活应对不同用户的综述需求。 工 无数据检索:以中国知网数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,仅支持中文 检索。 斯坦福STORM 斯坦福STORM平台是由斯坦福大学的oval团队开发的的一款AI科研工具,其核心功能是通过多智能体协作,实现 从提纲到段落再到文章的迭代式生成,为用户生成内容大纲及高质量长文本。 产品 概况 功能亮点 功能亮点 资料整合与文章生成:能够浏览网络,搜集大量文献, 并通过基于主题的多个智能代理,将这些文献转化为连0 码力 | 85 页 | 8.31 MB | 8 月前3
普通人学AI指南tokens 的训练数据,在推理、数学、 代码生成、指令跟踪等能力获得大幅度提升。 3.1 大模型 Llama3 3.1.1 步骤 1:安装 Ollama Ollama 可以简单理解为客户端,实现和大模型的交互。ollama 软件 win 和 mac 都包括,如图 11 所示。 13 Figure 11: Ollama 下载 在这里已经为大家准备好,只需要在我的微信公众号郭震 AI,回复消息: 快速部署:Docker 容器可以在几秒钟内启动,提高了开发和部署的效率。 2. 一致性:确保应用在开发、测试和生产环境中具有一致的运行环境。 3. 可移植性:容器可以在任何支持 Docker 的系统上运行,实现跨平台的可 移植性。 4. 易于扩展:Docker 可以方便地扩展并支持微服务架构的部署。 基本概念: 1. 容器(Container):轻量级、独立的可执行软件包,包含了运行所需的代 码、运行时、系统工具、系统库和设置。 本地知识库优势 部署本地知识库,可以借助大模型能力,自动检索我们的工作学习文档,实现 对文档内容的实时搜索与问答。 因为大模型、知识库和文档全部运行在本地,所以公司内的业务数据不会泄 密,个人隐私不会泄密,保证这些同时,让:办公效率直接原地起飞! 搭建完成后,实现的效果如图 28: Figure 28: 按照本文教程走完实现的本地知识库效果,大模型 + 个人知识库, 太香了! 5.2 docker0 码力 | 42 页 | 8.39 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 等传 统数据库均已支持向量检索。 6 / 32 LLM 基础设施:向量数据库/数据库向量支持 用较小、特定领域的数据集对模型进行后续训练,以使 其更好地适应特定的任务或应用场景。这一步骤使得通 用的大型模型能够在特定任务上表现出更高的精度和更 好的效果。 大模型框架提供了 LLM 的基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节。两者相结合, 使得 LLM 在广泛的应用场景中都能发挥出色的性能。 8 / 32 LLM 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点:0 码力 | 32 页 | 13.09 MB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利方向,成为社会与个人竞争力的关键。 p 选择中的再创造 面对AI提供的多种解法,人类需具备批判性思维与逻辑判断能力,通过选择最优答案,实现解决方案的创新 性再生。 p 智慧赋能的决策力 提出问题与甄别答案的能力,使人类在信息爆炸与AI辅助的时代,通过决策行为实现价值创造,成为社会发 展的持续动力。 善用DeepSeek的两大关键:提出问题 鉴别答案 DeepSeek是什么? • Dee 需明确约束目标,避免自由发挥 “写一个包含‘量子 ’和‘沙漠 ’ 的短篇小说 ,不超过200字 ” 开放式指令(如“ 自由创作 ”) 代码生成 推理模型 简洁需求,信任模型逻辑 “用Python实现快速排序 ” 分步指导(如“先写递归函数 ”) 通用模型 细化步骤, 明确输入输出格式 “先解释快速排序原理,再写出代 码并测试示例 ” 模糊需求(如“写个排序代码 ”) 多轮对话 通用模型 控制提示语长度的技巧: 避免嵌套复杂的指令 、 保持简洁性 、使用分步提示 如何实现精准定义: 明确的核心问题 、具体化的 策略一: 精准定义任务, 减少模糊性 生成指令 、去除多余信息 策略二: 适当分解复杂任务, 降低AI认知负荷0 码力 | 65 页 | 4.47 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场参与发明和创造, 增强人类的创造力 和创新能力 Organization •承担整个组织的 功能,独立管理 并执行复杂的操 作 • 致力于人机协同和人机共生领域的世界级团队,专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。 团队愿景 • 李默非(清华大学人工智能学院拟录博士生):人机共生之基座大模型研究研发 • 何静(清华博士后、北航助理教授):人机共生之快生引擎研究研发 • 一款全流程智能化创作工具,专注于将创意构思快速转化为高品质的视频成片。实时生成多达50个分镜脚本,并智能搭配分镜图、视频及音乐提示词,确保创意风格与 情感统一。软件支持美学意象风格的短片创作,具备角色一致性技术,离线生成样片,同时实现分镜自动成片功能,全面满足从创意策划到视频制作的高效智能化需求 一款基于人机快生理念的AI视频创作系统,从需求提交到成片仅需10分钟,即可输出75分质量的视频。 你想要生成什么样的文案? 这样的文案具备哪些特征? 200.00% 250.00% 300.00% 350.00% 杭州 深圳 成都 苏州 无锡 上海 青岛 厦门 宁波 北京 大模型A 大模型B 大模型C 大模型D 如何利用DeepSeek实现人机高效协作? 基本操 作技巧 人机协 作意识 能动 意识 边界 意识0 码力 | 35 页 | 9.78 MB | 8 月前3
00 Deepseek官方提示词射。 6. 代码生成:让模型生成一段完成特定功能的代码。 USER 请帮我用 HTML 生成一个五子棋游戏,所有代码都保存在一个 HTML 中。 7. 代码改写:对代码进行修改,来实现纠错、注释、调优等。 USER 下面这段的代码的效率很低,且没有处理边界情况。请先解释这段代码的问题与解决方法,然后进行优化: ``` def fib(n): if n <= 2:0 码力 | 4 页 | 7.93 KB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)要包括算力、算法和数据,框架层主要是指用于模型开发的 深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代,人工智能产业呈现出创新技术群体突 破、行业应用融合发展、国际合作深度协同等新特点,亟需 完善人工智能产业标准体系。 二、总体要求0 码力 | 13 页 | 701.84 KB | 1 年前3
共 11 条
- 1
- 2













