DeepSeek从入门到精通(20250204)例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 问题解决能力 擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 问题解决能力 擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini 次性完成表格生成后支持直接复制和表格文件下载。 Open AI o3mini能够更加高效地完成数据提取任务,输出表格准确,但暂不支持附件上传,文件读取依靠粘贴稍显不便;Kimi k1.5文 件数据提取有明显空缺。 结论 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 文本数据集成 1、分别阅读约7000token和15000token的文0 码力 | 85 页 | 8.31 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利@新媒沈阳 团队 : 陶炜博士生 普通人如何抓住DeepSeek红利 p Deepseek是什么? p Deepseek能够做什么? ——在工作、学习、生活和社会关系中解决问题 p 如何提问?让AI一次性生成你想要的东西 卷不动了?DeepSeek帮你一键“躺赢”! 学习太难?DeepSeek带你“开挂”逆袭! 生活太累?DeepSeek帮你“减负”到家! 若有时间,再精雕细琢 场景2:新员工快速熟悉公司情况和行业情况 场景:小李刚刚加入一家制造电子元器件的公司,作为一个新员工,他需要在短时间内熟悉公司的产品线、组织 结构、内部系统以及行业情况。然而,公司的产品手册复杂,部门间的职责不清晰,内部系统操作繁琐,行业信 息量庞大,这些都让小李感到不知所措。他担心自己无法在短时间内快速上手,影响工作效率和表现。 以往的解决方式: • 依赖同事的口头介绍,容易遗漏重要信 依赖同事的口头介绍,容易遗漏重要信 息。 • 手动查阅厚重的产品手册和内部文档, 耗时较长。 • 参加多部门的培训,但信息量大,难以 消化。 • 通过网络搜索行业信息,但信息分散, 难以整合。 场景2:新员工快速熟悉公司情况和行业情况 快速了解行业情况和市场趋势 DeepSeek可以整合行业报告、市场分析、竞争对手信 息等数据,帮助新员工快速掌握行业动态。 操作步骤 上传行业报告、市场分析文档、竞争对手资料等到0 码力 | 65 页 | 4.47 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告LLM 是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处 理领域,GPT 系列模型在文本生成、问答系统和对话生成 等任务 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 方法为语言任务提供了前所未有的性能,以此为基础,多模态融合的应用使得 为大模型提供高效的存储和检索能力 大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为0 码力 | 32 页 | 13.09 MB | 1 年前3
人工智能安全治理框架 1.0发展方向,为 推动政府、国际组织、企业、科研院所、民间机构和社会公众等各方,就人工 智能安全治理达成共识、协调一致,有效防范化解人工智能安全风险,制定本 框架。 1. 人工智能安全治理原则 秉持共同、综合、合作、可持续的安全观,坚持发展和安全并重,以促 进人工智能创新发展为第一要务,以有效防范化解人工智能安全风险为出发点 和落脚点,构建各方共同参与、技管结合、分工协作的治理机制,压实相关主 相关主 体安全责任,打造全过程全要素治理链条,培育安全、可靠、公平、透明的人 工智能技术研发和应用生态,推动人工智能健康发展和规范应用,切实维护国 家主权、安全和发展利益,保障公民、法人和其他组织的合法权益,确保人工 智能技术造福于人类。 1.1 包容审慎、确保安全。鼓励发展创新,对人工智能研发及应用采取 包容态度。严守安全底线,对危害国家安全、社会公共利益、公众合法权益的 风险及时采取措施。 风险导向、敏捷治理。密切跟踪人工智能研发及应用趋势,从人工 智能技术自身、人工智能应用两方面分析梳理安全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,0 码力 | 20 页 | 3.79 MB | 1 月前3
普通人学AI指南. . . . . . . . . 6 1.4.1 上下文窗口 . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.4.2 单位 B 和 T . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2 AI 工具梳理 6 2.1 问答 . . . . . . . . . . . . 大模型,AIGC 和 AGI 关系。 Figure 1: AI 大模型,AIGC 和 AGI 关系 4 1.2 AGI AGI(Artificial General Intelligence,人工通用智能)是一种理论上的人工智能, 它可以理解、学习和应用知识跨越各种不同领域,功能上等同于人类智能。 与专用人工智能(AI)不同,AGI 能够执行任何智力任务,具备自我意识和 自适应学习能力。AGI 练大量的数据来获 得广泛的知识和能力。这些模型通常具有庞大的参数数量,能够处理复杂的任 务,如自然语言理解、图像识别、语音识别等。 闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其 高效的学习能力和强大的通用性而受到关注。 开源大模型以 Meta 的 Llama 系列,2024 年 4 月,Llama3 发布,包括 8B 和 70B 模型。 图 2,时间线主要根据技术论文的发布日期(例如提交至0 码力 | 42 页 | 8.39 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502人工智能既能单兵作战,也能外部赋能 互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 建立AI信仰 6政企、创业者必读 大模型不是泡沫,而是新一轮工业革命的驱动引擎 7政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 从生成式AI,发展到推理型AI 从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9政企、创业者必读 人工智能发展历程(二) 从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI 从数字空间中的AI,走向能理解和操控物理空间的AI 从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」0 码力 | 76 页 | 5.02 MB | 5 月前3
国家人工智能产业综合标准化体系建设指南(2024版)加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 进人工智能赋能新型工业化,特制定本指南。 一、产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性 和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 要包括算力、算法和数据,框架层主要是指用于模型开发的 深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 2 表的新技术加速迭代,人工智能产业呈现出创新技术群体突 准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年,标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 50 项以上,引领人工智能产业0 码力 | 13 页 | 701.84 KB | 1 年前3
清华大学第二弹:DeepSeek赋能职场Chatbot •自然语言对话 Reasoner •基本的推理和问 题解决能力 Agent •代表用户执行任 务,具备自主行 动能力 Innovator • 参与发明和创造, 增强人类的创造力 和创新能力 Organization •承担整个组织的 功能,独立管理 并执行复杂的操 作 • 致力于人机协同和人机共生领域的世界级团队,专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。 些。 …… DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 操作路径多元、开放, 且对结果没有明确要求 Mermaid图表代码生成器 功能: 根据用户提供的流程或架构描述,自动生成符合Mermaid语法的图表代码。 技能: 熟悉Mermaid的图表类型和语法,能高效将流程转化为代码。 理解流程分析、架构设计及结构化展示等领域知识。 约束: 代码必须符合Mermaid语法规范。 流程和结构表达需准确清晰。 流程图需要有二级、三级等多层级。 输出的代码格式应简洁且易于理解。 工作流程: 询问用户希望绘制哪种类型的图表。0 码力 | 35 页 | 9.78 MB | 8 月前3
共 17 条
- 1
- 2













