非阻塞I/O - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek从入门到精通(20250204)

推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译等任务。快思慢想：效能兼顾全局视野概率预测（快速反应模型，如ChatGPT 4o）链式推理(慢速思考模型，如OpenAI o1) 性能表现响应速度快，算力成本低慢速思考，算力成本高运算原理基于概率预测，通过大量数据训练来快速预测可能的答案基于链式思维（Chain-of-Thought），逐步推理能够生成新的创意和解决方案，具备创新能力人机互动能力按照预设脚本响应，较难理解人类情感和意图更自然地与人互动，理解复杂情感和意图问题解决能力擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题，提供创造性的解决方案伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

推理模型 • 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译等任务。快思慢想：效能兼顾全局视野概率预测（快速反应模型，如ChatGPT 4o）链式推理(慢速思考模型，如OpenAI o1) 性能表现响应速度快，算力成本低慢速思考，算力成本高运算原理基于概率预测，通过大量数据训练来快速预测可能的答案基于链式思维（Chain-of-Thought），逐步推理能够生成新的创意和解决方案，具备创新能力人机互动能力按照预设脚本响应，较难理解人类情感和意图更自然地与人互动，理解复杂情感和意图问题解决能力擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题，提供创造性的解决方案伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。

0 码力 | 103 页 | 5.40 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

预训练范式像是记忆和模仿，强化学习范式更像探索实践  记住很多东西只是基础，真正有价值的是融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种政企、创业者必读快思考慢思考快慢人类真正智力表现的形式直觉经验型速度快、准确性低 GPT、DeepSeek-V3擅长的思考方式推理能力获得突破的关键是学会了「慢思考」自己跟自己对弈 ChatGPT时刻 • OpenAI ChatGPT大模型，通过预训练方式，实现涌现，理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习，但训练复杂推理能力，技术未公开 • DeepSeek-R1 探索出RL方法，且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29政企、创业者必读赋能企业数转智改数学计算语义理解逻辑推理语言翻译文本创作自动驾驶具身智能 1 2 4 5 知识问答代码编程文本生成多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science 知识管理（内部知识管理、外部情报分析、大数据分析、工作流知识）

0 码力 | 76 页 | 5.02 MB | 5 月前
3
清华大学普通人如何抓住DeepSeek红利

！学习太难？DeepSeek带你“开挂”逆袭！生活太累？DeepSeek帮你“减负”到家！社交障碍？DeepSeek教你“高情商”破局！ ZXDWsPoPvNtNtNnQnPpMsP8O8QaQpNpPsQqNeRqQnPkPnMpM9PoOwOxNpNsPuOqQpN p 提示词驱动的新生产力在AI时代，知识的获取成本趋近于零，拥有知识不再是核心竞争力。利用提示词创造知识，引领创新、明确 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。 (Pass@1) S v L C q Y 4 Y V 1 T 8 0 u m B k k m O x d k C i y K r j i 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、

0 码力 | 65 页 | 4.47 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

（如医疗、法律）进行优化，提供高精度结果。  长文本处理：擅长处理长文本和复杂文档，适合专业场景。  定制化能力：支持用户自定义训练和微调，适应特定需求。 Open AI o3 mini  小型化设计：轻量级模型，适合资源有限的环境。  快速响应：优化推理速度，适合实时交互场景。  通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。爬虫数据采集年春运（2025年1月14日到2月8日）相关数据（如日期、全社会跨区域人员流动量、铁路客运量、公路人员流动量、水路客运量、民航客运量等）”完成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快，能够高效提取所有需求链接，输出完整可运行python脚本，代码运行后生成文件，但数据采集结果为空。 DeepSeek R1 能够提取所有网址并进行筛选、去重，所撰写代码目前DeepSeek R1、Open AI o3mini、Kimi k1.5支持联网查询网址，Claude 3.5 sonnet暂不支持；  四个模型均能根据上传的网页代码，对多个网址链接进行筛选、去重，完全提取出符合指令要求的所有网址链接并形成列表；  在复杂爬虫任务上，DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务，o3响应速度更快，R1数据采集结果更加完

0 码力 | 85 页 | 8.31 MB | 8 月前
3
DeepSeek图解10页PDF

CoT）示例，用于支持后续的 SFT 阶段，如图7所示。更加详细介绍参考3.2节。 3.1.2 核心创新 2：通用强化学习第一阶段 R1-Zero 虽然展现出惊人的推理能力提升，但是也出现了回复时语言混合，非推理任务回复效果差的问题，为了解决这些问题，DeepSeek 提出通用强化学习训练框架。如图7所示，通用强化学习（General Reinforcement Learning）基于 SFT- R1-Zero 完全跳过监督微调这样做竟然达到了惊人的、意想不到的效果，推理超越 OpenAI O1，如下图10所示，蓝线表示单次推理（pass@1）的准确率，红线表示 16 次推理取一致性结果（cons@16）的准确率，可以看出一致性推理提高了最终性能。虚线代表 OpenAI O1 的基准表现，图中可以看到 DeepSeek-R1-Zero 的性能教程作者：郭震，工作 8 年目前美国逐步接近甚至超越了 OpenAI O1. 图 10: R1-Zero 惊人的推理能力中间模型虽然推理能力很强，但存在可读性和多任务能力不足的问题，所以才有了第二个创新。 3.3 通用强化学习训练过程最终偏好调整（Preference Tuning），如下图11所示。通用强化学习训练过程后，使得 R1 不仅在推理任务中表现卓越，同时在非推理任务中也表现出色。但由于其能力拓展至非推理类应用，因此在这些应用中引入了帮助性

0 码力 | 11 页 | 2.64 MB | 8 月前
3
人工智能安全治理框架 1.0

不完备、标注人员能力不够、标注错误等问题，不仅会影响模型算法准确度、可靠性、有效性，还可能导致训练偏差、偏见歧视放大、泛化能力不足或输出错误。（d）数据泄露风险。人工智能研发应用过程中，因数据处理不当、非授权访问、恶意攻击、诱导交互等问题，可能导致数据和个人信息泄露。 3.1.3 系统安全风险（a）缺陷、后门被攻击利用风险。人工智能算法模型设计、训练和验证的标准接口、特性库和工具包，以及开发界面和执行平台可能存在逻辑缺陷、- 涉毒等传统违法犯罪活动，包括传授违法犯罪技巧、隐匿违法犯罪行为、制作违法犯罪工具等。（c）两用物项和技术滥用风险。因不当使用或滥用人工智能两用物项和技术，对国家安全、经济安全、公共卫生安全等带来严重风险。包括极大降低非专家设计、合成、获取、使用核生化导武器的门槛；设计网络武器，通过自动挖掘与利用漏洞等方式，对广泛潜在目标发起网络攻击。 3.2.3 认知域安全风险（a）加剧 “信息茧房” 效应风险。人工智能将广泛应用于定制化的信息、范围和安全维度，构建多样化的测试数据集，涵盖各种应用场景。（h）研发者应制定明确的测试规则和方法，包括人工测试、自动测试、混合测试等，利用沙箱仿真等技术对模型进行充分测试和验证。（i）研发者应评估人工智能模型算法对外界干扰的容忍程度，以适用范围、注意事项或使用禁忌的形式告知服务提供者和使用者。（j）研发者应生成详细的测试报告，分析安全问题并提出改进方案。 6.2 人工智能服务提供者安全指引

0 码力 | 20 页 | 3.79 MB | 1 月前
3
清华大学第二弹：DeepSeek赋能职场

•承担整个组织的功能，独立管理并执行复杂的操作 • 致力于人机协同和人机共生领域的世界级团队，专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发 • 何静（清华博士后、北航助理教授）：人机共生之快生引擎研究研发 • 尤可可（清华博士后、北石化助理教授）：人机共生之AIGC短视频 • "Response"，想要的回应类型。一份详细的研究报告？一个表格？ Markdown格式？ "C"代表 “Context（上下文）” 相关的背景信息，比如你自己或是你希望它完成的任务的信息。 "O"代表 “Objective （目标）” 明确的指示告诉 AI你希望它做什么。 "S"代表“Style （风格）” 想要的写作风格，如严肃的、有趣的、创新性表达、学术性…… "T"代表“Tone

0 码力 | 35 页 | 9.78 MB | 8 月前
3
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

among open-source models. The model checkpoints are available at h t t p s : / / g i t h u b . c o m / d e e p s e e k - a i / D e e p S e e k - V 2 . 0 20 40 60 80 100 Activated Parameters (Billions) 55 2; ...; k?,?ℎ] = k?, (5) [v?,1;v?,2; ...; v?,?ℎ] = v?, (6) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √ ?ℎ )v?,?, (7) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (8) where q?,?, k?,?, v?,? ∈ R?ℎ denote the query, key [q? ?,?; q? ?,?], (16) k?,? = [k? ?,?; k? ? ], (17) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √︃ ?ℎ + ?? ℎ )v? ?,?, (18) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (19) where ??? ∈ R?? ℎ ?ℎ×?′ ? and ? ?? ∈ R??

0 码力 | 52 页 | 1.23 MB | 1 年前
3
Trends Artificial Intelligence

Cloud GPUs Computing Cycles Over Time – 1960s-2020s, per Morgan Stanley Note: Axis is logarithmic; i.e., there are expected to be tens of thousands more AI Era devices than Mainframe devices 1960 Department of Homeland Security unveils its AI Roadmap Strategy 5/24: OpenAI releases GPT-4o, which has full multimodality across audio, visual, & text inputs 7/24: Apple releases Apple 12/24: OpenAI announces o3, its highest-ever performing model 1/25: Alibaba unveils Qwen2.5-Max, which surpasses the performance of other leading models (GPT- 4o, Claude 3.5) on some

0 码力 | 340 页 | 12.14 MB | 4 月前
3

共 27 条前往

页

分类

语言

格式