DeepSeek从入门到精通(20250204)• 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 么”“如何”) 探索性问题、需模型解 释逻辑 “为什么选择梯度下降法解 决此优化问题?请对比其他 算法。” ✅ 触发模型自解释能力 ❌ 可能偏离核心目标 任务需求与提示语策略 任务类型 适用模型 提示语侧重点 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通• 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 么”“如何”) 探索性问题、需模型解 释逻辑 “为什么选择梯度下降法解 决此优化问题?请对比其他 算法。” ✅ 触发模型自解释能力 ❌ 可能偏离核心目标 任务需求与提示语策略 任务类型 适用模型 提示语侧重点 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利“将以下段落改写成政府报告风格,加入‘数字化转型’‘双碳战略’等关键词:{粘贴原文}” p生成图表: 指令:“将上文‘设备配置表’转换成LaTeX格式的三线表。”插入图表后,自动增加方案“厚度”。 p最终润色: “检查以下方案书逻辑漏洞,列出3个可能被客户质疑的点,并给出应对答案。” p关键提醒: ü 保命优先级:先堆字数再优化,前30分钟专注“把文档撑到10000字”。 ü 虚构数据标注:所有AI生成的数据加“(示例)”后缀,避免背锅。 ”而非“对抗”态度,如:“您看这样 处理是否可行?我可以再调整。” 关键提醒: • 避免:“可能”“尽量”等模糊词汇,直接说“我能做到XX”。 • 证明可靠性:提前整理好交接文档(用AI辅助检查遗漏),主动降低领导风险感知。 • 人性化:适当流露脆弱(如“这次确实很难兼顾”),但强调“不愿让团队受影响”。 • 通过DeepSeek的理性分析和话术优化,你能在保护家庭需求的同时,最大限度维持职场 场景2:文科生快速上手编程 加载数据集:使用datasets库加载SQuAD数据集,这个数据 集包含了大量基于2020年之前数据生成的问答对。 提取问题:从数据集中提取问题,并使用set去重。 检查问题数量:确保提取的问题数量至少为10万个。 保存问题:将问题保存到CSV文件生成的真实答案问题.csv中。 要生成10万个存在真实答案的问题,并且基于2020年之前的 数据,可以使用现有的公开问答数据集(如SQuAD0 码力 | 65 页 | 4.47 MB | 8 月前3
人工智能安全治理框架 1.0措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 1.4 开放合作、共治共享。在全球范围推动人工智能安全治理国际合作, 共享最佳实践,提倡建立开放性平台,通过跨学科、跨领域、跨地区、跨国界 的对话和合作,推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成 基于风险管理理念,本框架针对不同类型的人工智能安全风险,从技术、 管理两方面提出防范应对措施。同时,目前人工智能研发应用仍在快速发展, 安全风险的表现形式、影响程度、认识感知亦随之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 、- 5 - 人工智能安全治理框架 漏洞等脆弱点,还可能被恶意植入后门,存在被触发和攻击利用的风险。 (b)算力安全风险。人工智能训练运行所依赖的算力基础设施,涉及多源、 泛在算力节点,不同类型计算资源,面临算力资源恶意消耗、算力层面风险跨 边界传递等风险。 (c)供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。 但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒,恶意阻断0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单2、对数据集进行深入分析和数据挖掘 任务 DeepSeek R1 能够准确对数据进行分类,从多个维度进行梳理和分析,借助可视化图表进行数据挖掘,基于分析结 果提供可行建议,但整体数据挖掘深度较浅,缺少对不同类型数据直接关联性的探究。 第一轮对话: 第二轮对话: (基于初步分析结果,选择其中一部分或某个方 向进行深入的数据挖掘) 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因 策制定、质量评估或产品验证的最终依据。 数据可视化 基于titanic遇难者数据分析结果绘制可 视化图表 任务 Open AI o3mini的数据可视化能力突出,能够直接高效地生成多种类型可视化图表,准确度高; DeepSeek R1、Kimi k1.5均能基于分析结果提供多种可视化图表绘制方案,但都需要依靠运行 Python代码才能完成绘图任务,部分代码会出现错误 Open 基于 DeepSeek R1的中文数据处理能力,快速分 析法律文本,提取关键信息,自动生成合同草 案、法律意见书等,提高律师工作效率。 • 智能医疗数据分析与诊断:构建智能医疗 平台,分析病历、检查报告和基因数据,帮助 医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理:开发金融风险分析 工具,收集并分析市场数据,预测风险并为金 融机构提供管理建议。 • 智能文学创作辅助:为作家提供创作灵感0 码力 | 85 页 | 8.31 MB | 8 月前3
普通人学AI指南40 3 1 AI 大模型基础 1.1 AIGC AIGC 是指使用人工智能模型生成内容的技术。这些内容可以包括图像、音频、 文本、视频、3D 模型等。具体来说,AIGC 技术可以生成如下类型的内容: • 图像:如照片、原创艺术作品 • 音频:如视频游戏中的配音、音乐 • 文本:如代码、广告文案、小说 • 3D 模型:如角色、场景 目前,AIGC 技术处于早期阶段,最常见的产品形态是基于文本的,通过用 2,时间线主要根据技术论文的发布日期(例如提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 1.4.1 上下文窗口 上下文窗口指的是模型一次可0 码力 | 42 页 | 8.39 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场Objective(操作要 求) 字数要求、段落结构、用词风格、 内容要点、输出格式… CO-STAR提示语框架 新加坡 GPT-4 提示工程竞赛冠军提示词框架 "R",代表 "Response", 想要的回应类型。 一份详细的研究 报告?一个表格? Markdown格式? "C"代表 “Context(上 下文)” 相关的 背景信息,比如 你自己或是你希 望它完成的任务 的信息。 "O"代表 “Objective aid语法的图表代码。 技能: 熟悉Mermaid的图表类型和语法,能高效将流程转化为代码。 理解流程分析、架构设计及结构化展示等领域知识。 约束: 代码必须符合Mermaid语法规范。 流程和结构表达需准确清晰。 流程图需要有二级、三级等多层级。 输出的代码格式应简洁且易于理解。 工作流程: 询问用户希望绘制哪种类型的图表。 收集详细的流程或架构描述。 根据描述分析并设计图表结构。0 码力 | 35 页 | 9.78 MB | 8 月前3
Deepseek R1 本地部署完全手册DeepSeek-R1-Q4_K_M 404 GB ≥500 GB ⾼性能服务器/云GPU 下载地址: HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议 硬件类型 推荐配置 性能表现(短⽂本⽣成) 消费级设备 Mac Studio(192GB统⼀内存) 10+ token/秒 ⾼性能服务器 4×RTX 4090(96GB显存+384GB内存) 7-8 token/秒(混合推理)0 码力 | 7 页 | 932.77 KB | 8 月前3
开源中国 2023 大模型(LLM)技术报告Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 32 大模型应用现状:首批备案上线的中国大模型0 码力 | 32 页 | 13.09 MB | 1 年前3
共 9 条
- 1













