DeepSeek从入门到精通(20250204)),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 问题解决能力 擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成 推理模型 简洁需求,信任模型逻辑 “用Python实现快速排序”0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 问题解决能力 擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成 推理模型 简洁需求,信任模型逻辑 “用Python实现快速排序”0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本 向,高效生成多个维度的数据分析,语言 简洁,挖掘深度较浅。 Kimi k1.5 提供数据的潜在用途方向,深入分 析过程中,从多个维度(如时间、 语言、地区)深入挖掘数据意义和 关联性,进一步总结趋势结论并提 出相关建议。 Kimi k1.5该任务中表现最为出色,对特征进行精准分类,从多维度深入挖掘指定数据的深层内涵和关联性; DeepSeek R1与Claude 3.5 sonnet同样能准确完成 案、法律意见书等,提高律师工作效率。 • 智能医疗数据分析与诊断:构建智能医疗 平台,分析病历、检查报告和基因数据,帮助 医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理:开发金融风险分析 工具,收集并分析市场数据,预测风险并为金 融机构提供管理建议。 • 智能文学创作辅助:为作家提供创作灵感 和文本构思,生成符合中文文学传统的故事情 节和诗句,助力突破创作瓶颈。 • 智能广告创意生成:根据产品特点和目标0 码力 | 85 页 | 8.31 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502推理能力获得突破的关键是学会了「慢思考」 例:课堂提问 快问快答 长思维链强大的推理能力是真正人类智力的体现 预训练大模型是人记忆和学习的能力,推理模型是对复杂问题 进行规划、分解、预测的能力,实现了真正的慢思考 28 例:课后作业 仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律,加速了AGI发展 Alpha Zero时刻 AlphaFold 1. X射线晶体衍射 2. 核磁共振 3. 冷冻电子显微镜 1. 利用Transformer的预测能力, 2. 直接从蛋白质的氨基酸序列 3. 中预测蛋白质的3D结构 靠肉眼观察,几年才能发现一个复杂蛋 白质结构,半个世纪预测了20多万种 从数年缩短到几分钟,解开了生物学密码 成功预测了地球存在的2亿种蛋白质结构 45政企、创业者必读 DeepSeek典型的四大安全问题:客户端 烧结设备运行工况检测 • 料场生产计划智能配置 • 烧结矿成分预测 • 烧结矿质量预测 • 烧结烟气 S02 排放在 线预测与控制 • 构建能源消耗预测 • 智能故障诊断 • 挡板位移检测 • 皮带划痕、 撕裂、 跑偏检测预警 • 1球团皮带智能监测 • 生球粒度分布在线 识别 • 球团1颗粒粒度检测 • 球团1现场生产安全 态势感知与预警 • 皮带机预测性维护 • 建立设备健康模型 • 焦化皮带智能监测0 码力 | 76 页 | 5.02 MB | 5 月前3
清华大学 普通人如何抓住DeepSeek红利场景:下午3点,你突然接到领导通知:“今晚4点前必须交一份10000字的智能物流园区项目方案书,客户临时提 前会议!”你大脑一片空白——手头只有零散的会议记录、几份过时的模板,且对“智能物流”技术细节不熟。电 脑右下角显示时间:3:05 PM,你手心冒汗,疯狂翻找资料,但文档光标始终停留在标题页…… 场景1:1小时内写完一个1万字的项目书 是否可用DeepSeek(深度求索)辅助处理? 可以,但需分阶段“榨干AI效 距调宽,快速“膨胀”页数。 ü 若有时间,再精雕细琢 场景2:新员工快速熟悉公司情况和行业情况 场景:小李刚刚加入一家制造电子元器件的公司,作为一个新员工,他需要在短时间内熟悉公司的产品线、组织 结构、内部系统以及行业情况。然而,公司的产品手册复杂,部门间的职责不清晰,内部系统操作繁琐,行业信 息量庞大,这些都让小李感到不知所措。他担心自己无法在短时间内快速上手,影响工作效率和表现。 以往的解决方式: 展趋势”等关键词,生成简洁的分析报告。 优势 通过DeepSeek的数据分析功能,快速生成行业概览, 节省了手动整理的时间。 通过DeepSeek的多维度分析,深入了解行业的竞争格 局和市场机会。 效率更高: DeepSeek通过整合信息源和智能搜索,减少了手动查 找和整理的时间,新员工可以在短时间内快速上手。通 过自动化的信息检索和分析,新员工可以更快地掌握公 司和行业的关键信息。 效果更好: 信0 码力 | 65 页 | 4.47 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)标准。 7. 生物特征识别标准。规范生物特征样本处理、生物特征 数据协议、设备或系统等技术要求,包括生物特征数据交换格式、 接口协议等标准。 8. 人机混合增强智能标准。规范多通道、多模式和多维度 的交互途径、模式、方法和技术要求,包括脑机接口、在线知识 演化、动态自适应、动态识别、人机协同感知、人机协同决策与 控制等标准。 9. 智能体标准。规范以通用大模型为核心的智能体实例和 制相 关供应链管理、数据管理、风险管理等标准。 12 6. 重点行业智能升级标准。围绕原材料行业,开展大模型 畅联产线数据、优化在线监测调控和工艺改进等标准研制。围绕 消费品行业,开展需求预测、个性化定制等标准研制。围绕装备 行业,研制智能装备感知、交互、控制、协作、自主决策等标准。 (六)行业应用标准 开展智慧城市、科学智算、智慧农业、智慧能源、智慧环保、 智慧金融、智慧物流、智慧教育、智慧医疗、智慧交通、智慧文0 码力 | 13 页 | 701.84 KB | 1 年前3
人工智能安全治理框架 1.0使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3.1.1 模型算法安全风险 (a)可解释性差的风险。以深度学习为代表的人工智能算法内部运行逻 辑复杂,推理过程属黑灰盒模式,可能导致输出结果难以预测和确切归因,如 有异常难以快速修正和溯源追责。 (b)偏见、歧视风险。算法设计及训练过程中,个人偏见被有意、无意引入, 或者因训练数据集质量问题,导致算法设计目的、输出结果存在偏见或歧视, 动挖掘与利用漏洞等方式,对广泛潜在目标发起网络攻击。 3.2.3 认知域安全风险 (a)加剧 “信息茧房” 效应风险。人工智能将广泛应用于定制化的信息 服务,收集用户信息,分析用户类型、需求、意图、喜好、行为习惯,甚至特 定时间段公众主流意识,进而向用户推送程式化、定制化信息及服务,“信息茧房” 效应进一步加剧。 (b)用于开展认知战的风险。人工智能可被利用于制作传播虚假新闻、- 7 - 人工智能安全治理框架 图像 需从 训练数据、算力设施、模型算法、产品服务、应用场景各方面采取技术措施予 以防范。 4.1 针对人工智能内生安全风险 4.1.1 模型算法安全风险应对 (a)不断提高人工智能可解释性、可预测性,为人工智能系统内部构造、- 8 - 人工智能安全治理框架 推理逻辑、技术接口、输出结果提供明确说明,正确反映人工智能系统产生结 果的过程。 (b)在设计、研发、部署、维护过程中建立并实施安全开发规范,尽可0 码力 | 20 页 | 3.79 MB | 1 月前3
开源中国 2023 大模型(LLM)技术报告Weaviate:已融资 Vespa:已融资 Chroma:已融资 Qdrant:已融资 Marqo:已融资 LanceDB:已融资 …… 据西南证券研究发展中心预测,2025 年向量数据库渗透率约 为 30%,则全球向量数据库市场规模约为 99.5 亿美元, 。 2023 年前四个月,向量数据库公司融资额 ,超过了 2022 年的总和 (图源:https://www 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 紫东太初、百川智能、智谱华章等0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek图解10页PDFLLM))的兴起。LLM 在自然语言处理(NLP)领域 发挥着越来越重要的作用,广泛应用于智能问答、文本生成、代码编写、机 器翻译等任务。LLM 是一种基于深度学习的人工智能模型,其核心目标是 通过预测下一个单词来理解和生成自然语言。训练 LLM 需要大量的文本数 据,使其能够掌握复杂的语言模式并应用于不同任务。 接下来,咱们先从较为基础的概念开始。 2.1 LLM 基础概念 模型参数。其 预训练(Pretraining) LLM 训练通常采用大规模无监督学习,即:1. 从互联网上收集大量文本数 据,如书籍、新闻、社交媒体等。2. 让模型学习词语之间的概率分布,理解 句子结构。3. 训练目标是最小化预测误差,使其能更好地完成语言任务。 2.3.2 监督微调(Supervised Fine-Tuning, SFT) 在预训练之后,通常需要对模型进行监督微调(SFT):使用人工标注的数 据集,让0 码力 | 11 页 | 2.64 MB | 8 月前3
普通人学AI指南和 70B 模型。 图 2,时间线主要根据技术论文的发布日期(例如提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 工具梳理 大家有没有觉得 AI 工具太多,种类太多,老的还没用,新的就出来,头大得 很!有没有这种感觉?所以,在这一章,梳理主流的 AI 工具,注意不是穷举, 那些不经常用的工具,不浪费文字和耽误时间。 梳理总结六大类 AI 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT 然后点击右下角创建并导入,如下图 43所示: 36 Figure 43: MaxKB 界面-知识库配置续 导入后,系统就会开始处理分析和接入,如图 44所示,文档导入时间长短取 决于文档内容的多少,内容越多,导入时间就越长。 Figure 44: MaxKB 界面-知识库配置续 5.6 MaxKB 配置本地 llama3 MaxKB 网站内的应用界面中,按照如下所示,图 45点击系统设置,然后再进0 码力 | 42 页 | 8.39 MB | 8 月前3
共 11 条
- 1
- 2













