DeepSeek从入门到精通(20250204)直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 表1-3-2提示语设计进阶技能子项 核心技能 子项 语境理解 深入分析任务背景和隐含需求 考虑文化、伦理和法律因素 预测可能的误解和边界情况 抽象化能力 识别通用模式,提高提示语可复用性 设计灵活、可扩展的提示语模板 创建适应不同场景的元提示语 批判性思考 客观评估AI输出,识别潜在偏见和错误 设计反事实提示语,测试AI理解深度 构建验证机制,确保AI输出的可靠性 创新思维 探索非常规的提示语方法 表1-3-3提示语设计进阶技能子项 核心技能 子项 语境理解 深入分析任务背景和隐含需求 考虑文化、伦理和法律因素 预测可能的误解和边界情况 抽象化能力 识别通用模式,提高提示语可复用性 设计灵活、可扩展的提示语模板 创建适应不同场景的元提示语 批判性思考 客观评估AI输出,识别潜在偏见和错误 设计反事实提示语,测试AI理解深度 构建验证机制,确保AI输出的可靠性 创新思维 探索非常规的提示语方法0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 表1-3-2提示语设计进阶技能子项 核心技能 子项 语境理解 深入分析任务背景和隐含需求 考虑文化、伦理和法律因素 预测可能的误解和边界情况 抽象化能力 识别通用模式,提高提示语可复用性 设计灵活、可扩展的提示语模板 创建适应不同场景的元提示语 批判性思考 客观评估AI输出,识别潜在偏见和错误 设计反事实提示语,测试AI理解深度 构建验证机制,确保AI输出的可靠性 创新思维 探索非常规的提示语方法 表1-3-3提示语设计进阶技能子项 核心技能 子项 语境理解 深入分析任务背景和隐含需求 考虑文化、伦理和法律因素 预测可能的误解和边界情况 抽象化能力 识别通用模式,提高提示语可复用性 设计灵活、可扩展的提示语模板 创建适应不同场景的元提示语 批判性思考 客观评估AI输出,识别潜在偏见和错误 设计反事实提示语,测试AI理解深度 构建验证机制,确保AI输出的可靠性 创新思维 探索非常规的提示语方法0 码力 | 103 页 | 5.40 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)群体智能标准。规范群体智能算法的控制、编队、感知、 规划、决策、通信等技术要求和评测方法,包括自主控制、协同 控制、任务规划、路径规划、协同决策、组网通信等标准。 11. 跨媒体智能标准。规范文本、图像、视频、音频等多模 态数据处理基础、转换分析、融合应用等方面的技术要求,包括 数据获取与处理、模态转换、模态对齐、融合与协同、应用扩展 等标准。 12. 具身智能标准。规范多模态主动与交互、自主行为学习、0 码力 | 13 页 | 701.84 KB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 析复杂数据,帮助科学研究和工程领域发现 模式和规律,如天文学中的星系演化或地质 学中的地震数据分析。 • 多源数据融合分析:在智能交通和城市 规划中,o3mini有助于将不同来源的数据 (如交通流量、气象数据等)进行融合分析, 预测交通拥堵,为城市规划提供决策支持。 • 交互式数据可视化:在商业智能和数据 分析领域,o3mini可以将多维数据以可视化 的方式呈现,并支持用户进行交互式分析。 端到端强化学习 3.深度信息整合 输入 提示 文本、图像、 PDF 解释、推理 调整 优化 查找、分析 综合数百个 在线资源 以研究分析师的水平 创建一份综合报告 端到端强化学习 训练 规划执行多步 骤研究流程 实时调整策略 回溯修正错误 文本 PDF 图像 【多格式数据】 支持搜索多格式数据, 整合多模态信息,生 成带引用和思考过程 总结的报告 Text Text Text0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利情感分析 文本分类 图像理解 跨模态转换 专业建议 任务分解 情感回应 上下文理解 对话能力 多轮对话 数学运算 逻辑分析 能力图谱 诗歌创作 语音识别 指令理解 方案规划 实体识别 l 文本创作 文章/故事/诗歌写作 营销文案 、广告语生成 社交媒体内容(如推文 、帖子) 剧本或对话设计 l 摘要与改写 长文本摘要(论文 、报告) 文本简化(降低复杂度) 格式要求 简单任务 、需快速执行 “用Python编写快速排序函 数, 输出需包含注释 。 ” 结果精准高效 限制模型自主优化空 间 需求导向 描述问题背景与目标, 由模型规划解决路径 复杂问题 、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案 。 ” 激发模型深层推理 需清晰定义需求边界 混合模式 结合需求描述与关键 智能体认知循环边界并非终点,而是人类探索未知领域和创造 新价值的起点。研究提出基于“自指性”和“循环性”的测量 机制,识别智能体生成内容触及边界的临界点,为优化生成内 容提供量化依据。这一框架可扩展至多模态生成系统,并在教 育、科研和创新领域推动知识生成模式从常规化迈向创新化。 多轮交互中,智能体容易触及认知边界,表现为生成内容的固 定化和信息增量的终止。实验显示,高收敛性提示语导致内容0 码力 | 65 页 | 4.47 MB | 8 月前3
Deepseek R1 本地部署完全手册2. 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile: 5. 运⾏模型: 4. 性能调优与测试 GPU利⽤率低:升级⾼带宽内存(如DDR5 5600+)。 扩展交换空间: 六、注意事项与⻛险提示 1. 成本警示: 70B模型:需3张以上80G显存显卡(如RTX A6000),单卡⽤户不可⾏。 671B模型:需8xH100集群,仅限超算中⼼部署。 2 李锡涵博客:完整部署教程 结语 Deepseek R1 的本地化部署需极⾼的硬件投⼊与技术⻔槛,个⼈⽤户务必谨慎,企业⽤户应充 分评估需求与成本。通过国产化适配与云端服务,可显著降低⻛险并提升效率。技术⽆⽌境, 理性规划⽅能降本增效! ⼿册更新与反馈:如有补充或修正,请联系⽂档作者,接⼊细节请阅读详细⽂档硅基流动社 区。 全球企业个⼈渠道附表 1. 秘塔搜索:https://metaso.cn 2. 360纳⽶AI搜索:https://www0 码力 | 7 页 | 932.77 KB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502累知识,Scaling law撞墙 预训练模型思考深度不够 算力见顶,变成少数巨头游戏 预训练大模型 推理大模型 预训练大模型难以通往AGI之路 推理模型如R1——通过逻辑链条推导答案, 分解规划,自我反思 预训练范式像是记忆和模仿,强化学习范 式更像探索实践 记住很多东西只是基础,真正有价值的是 融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 思考方式 推理能力获得突破的关键是学会了「慢思考」 例:课堂提问 快问快答 长思维链强大的推理能力是真正人类智力的体现 预训练大模型是人记忆和学习的能力,推理模型是对复杂问题 进行规划、分解、预测的能力,实现了真正的慢思考 28 例:课后作业 仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律,加速了AGI发展 Alpha 与大模型直接聊天,输入简单提示词,无Agent能力 具备简单GUI交互界面,可进行一些设置 用内部提示词进行角色设定 具备GUI界面的多个步骤的工具软件 L2 L1 L0 可执行复杂的规划、推理、分解、预测流程的工作流 与企业业务流程、组织、系统打通 L3 L5 L4 多个Agent的相互协作 L6 64政企、创业者必读 示例:斯坦福医疗预约中心的AI化改造 智能体应用案例:定义角色、分解流程0 码力 | 76 页 | 5.02 MB | 5 月前3
DeepSeek图解10页PDFScaling Laws(扩展规律)的指导和模型自身架构的优势。 Scaling Laws 指出参数越多,模型学习能力越强;训练数据规模越大、越多 元化,模型最后就会越通用;即使包括噪声数据,模型仍能通过扩展规律提 取出通用的知识。而 Transformer 这种架构正好完美做到了 Scaling Laws, Transformer 就是自然语言处理领域实现扩展规律的最好的网络结构。 2 顺 序信息。 Transformer 结构的优势 1. 高效的并行计算:摒弃循环结构,使计算速度大幅提升。 2. 更好的上下文理解:注意力机制可捕捉长文本中的远程依赖关系。 3. 良好的可扩展性:可适配更大规模模型训练,增强 AI 泛化能力。 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取0 码力 | 11 页 | 2.64 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 :它们提供工具来有效地加 载、处理和迭代大型数据集,这对于训练大 型模型尤为重要。 国产深度学习框架 OneFlow 架构 (图源:https://www 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。 这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和 库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow 架构图 (图源:https://www0 码力 | 32 页 | 13.09 MB | 1 年前3
普通人学AI指南效率。 2. 一致性:确保应用在开发、测试和生产环境中具有一致的运行环境。 3. 可移植性:容器可以在任何支持 Docker 的系统上运行,实现跨平台的可 移植性。 4. 易于扩展:Docker 可以方便地扩展并支持微服务架构的部署。 基本概念: 1. 容器(Container):轻量级、独立的可执行软件包,包含了运行所需的代 码、运行时、系统工具、系统库和设置。 2. 镜像(Imag0 码力 | 42 页 | 8.39 MB | 8 月前3
共 11 条
- 1
- 2













