清华大学 DeepSeek 从入门到精通文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单工具,收集并分析市场数据,预测风险并为金 融机构提供管理建议。 • 智能文学创作辅助:为作家提供创作灵感 和文本构思,生成符合中文文学传统的故事情 节和诗句,助力突破创作瓶颈。 • 智能广告创意生成:根据产品特点和目标 受众自动生成创意广告文案和宣传语,提高广 告创作效率。 • 中小企业AI定制化服务:为中小企业提 供定制化的AI解决方案,如智能客服、营销 和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek 需进行复 杂操作,等待平台处理完成即可。 综述生成:根据智能分析结果,平台自动生成结构化的文献综述文本内容和可视化图表,用户可直接获取 完整的综述报告,也可根据需要进行自定义调整,如综述主题、目标、参数等。 知网研学平台官网:https://aiplus.cnki.net/sumup/sumup 输入关键词:进入官网后,在搜索框键入关键词进行文献检索。 选取文章:勾选想要分析的20篇文献。 模型蒸馏技术 DeepSeek采用模型蒸馏技术,通过将知识从大型复杂模型 (教师模型)迁移到小型高效模型(学生模型),实现性能和 效率的双重优化。DeepSeek选择了多个开源模型作为蒸馏的 目标模型,包括Qwen 系列和Llama 系列 架构创新 通过将模型划分为多个专家模块,实 现高效计算和推理。DeepSeek通过 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平0 码力 | 85 页 | 8.31 MB | 8 月前3
Kubernetes Operator 实践 - MySQL容器化技术体系 CRM 广告平台 物料展现 审核平台 大数据平台 基础架构 Golang C++ JavaScript Java Python 质量要求高 业务响应快 故障恢复快 Cluster1 搜狗商业平台业务系统 搜索推广 信息流 品牌 BizNginx (Load Balancer) Kafka Zookeeper etcd AppEngine(Resin/Tomcat…) 增加2个副本 当前副本数:3 Controller 的基本原理 1. 背景介绍 2. Operator 的基本原理 3. MySQL Operator 设计实践 4. 小结 MySQL 容器化目标 • 快速部署 MySQL 主从集群 • 支持 MySQL 集群高可用 • 支持 MySQL 集群弹性伸缩 • 支持 MySQL 5.5 & 5.7 Master Slave1 Slave20 码力 | 42 页 | 4.77 MB | 1 年前3
Ubuntu 桌面培训 2010关于这个著作权协议的更多信息,请参阅: http://creativecommons.org/licenses/by-nc-sa/3.0/legalcode 2 目录 Lucid Lynx 目录 课程概况 27 目标对象和前提要求 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 如何查看、绘制、处理和扫描图像 • 如何播放、编辑和管理您的音乐和视频文件 • 如何从免费的或商业的资源中获取关于 Ubuntu 的帮助 • 如何创建分区和使用双启动选项 目标对象和前提要求 本课程为家庭用户和办公室用户提供 Ubuntu 操作系统的培训。目标对象不必预先了 解 Ubuntu,但必须具备基本的计算机使用能力。要开始学习本课程,请先在您的计 算机硬盘上安装 Ubuntu 10.04 LTS。 28 在第一天要首先做的: 1. 欢迎学生们,然后做一个自我介绍,再让学生们介绍自己,包括名字、职业背景、 所在公司、对本课程的期望和对 Linux 操作系统的熟悉程度。 2. 明确介绍整个培训的教学意图和目标。 3. 制定课间休息的规则。 内容设置 使用下列方法: • 对主题进行简要介绍。 • 从学习者的角度解释为何该主题很重要。 • 联系之前学习的主题 主要内容 您可以使用以上介绍的任0 码力 | 540 页 | 26.26 MB | 1 年前3
RocketMQ v3.2.4 开发指南commonmq v1.0 = Notify + RocketMQ + B2B 个性化需求 为 B2B 应用提供消息服务 3 与业术语 Producer 消息生产者,负责产生消息,一般由业务系统负责产生消息。 Consumer 消息消费者,负责消费消息,一般是后台系统负责异步消费。 Push Consumer Consumer 的一种,应用通常吐 Consumer 普通顺序消息 顺序消息的一种,正常情冴下可以保证完全的顺序消息,但是一旦収生通信异常,Broker 重启,由亍队列 总数収生发化,哈希叏模后定位的队列会发化,产生短暂的消息顺序丌一致。 如果业务能容忍在集群异常情冴(如某个 Broker 宕机戒者重启)下,消息短暂的乱序,使用普通顺序方 式比较合适。 严格顺序消息 顺序消息的一种,无论正常异常情冴都能保证顺序,但是牺牲了分布式 绝大部分的优兇级问题,但是对业务的优兇级精确性做了妥协。 2) 严格的优兇级,优兇级用整数表示,例如 0 ~ 65535,返种优兇级问题一般使用丌同 topic 解决就非常丌合 项目开源主页:https://github.com/alibaba/RocketMQ 5 适。如果要让 MQ 解决此问题,会对 MQ 的性能造成非常大的影响。返里要确保一点,业务上是否确实需 要返种严格的0 码力 | 52 页 | 1.61 MB | 1 年前3
消息中间件RocketMQ原理解析 - 斩秋比如购买流程(1)下单(2)支付(3)支付成功,这三个消息需要根据 特定规则将这个三个消息按顺序发送到一个 queue 如何实现把顺序消息发送到同一个 queue: 一般消息是通过轮询所有队列发送的,顺序消息可以根据业务比如说订单号 orderId 相同的消息发送到同一个队列, 或者同一用户 userId 发送到同一队列等等 messageQueueList [orderId%messageQueueList LocalTransactionExecuter , 处 理 本 地 事 物 逻 辑 返 回 处 理 的 事 物 状 态 LocalTransactionState 3) 二阶段,处理完本地事物中业务得到事物状态, 根据 offset 查找到 commitLog 中 的 prepared 消息,设置消息状态 commitType 或者 rollbackType , 让后将信息添加到 commitLog consumer 通过长轮询拉取消息后回调 MessageListener 接口实现完成消费, 应用系统只要 MessageListener 完成业务逻辑即可 2. Pull 方式:完全由业务系统去控制,定时拉取消息,指定队列消费等等, 当然这里需要 业务系统去根据自己的业务需求去实现 下面介绍默认以 push 方式为主, 因为绝大多数是由 push 消费方式来使用 rocketmq 的。0 码力 | 57 页 | 2.39 MB | 1 年前3
2022 Apache Ozone 的最近进展和实践分享HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OTHER WORKLOADS OTHER WORKLOADS X • 可⽤于承载实时和批处理的业务 • 扩展性提升 • ⽆需改变或改造业务应⽤代码 • 降低控制平⾯的节点数和服务依赖 业务价值 • 降低⼤规模集群的运维难度 • 可通过HDFS API和Distcp进⾏快速迁移 • 降低系统恢复时间 • 尽可能的减少NN Apache Ozone – 使⽤场景 #2 • 可以快速的对接已适配S3 接⼝的应⽤ • 减少数据在多个平台间的迁移 • 使⽤单⼀的API协议来应对混合云架构 业务价值 • 集约化的⼀套存储来⾯向不同的业务负载 • 更易于运维的控制⾯ • 只需要⼀个运维团队⽽不是多个 运维价值 OZONE STORAGE AI/ML HIVE/IMPALA/ SPARK KAFKA0 码力 | 35 页 | 2.57 MB | 1 年前3
谈谈MYSQL那点事用这种架构模式 弱一致性 如果是弱一致性的话,可以通过在 M2 上面分担一些读压力 和流量,比如一些报表的读取以及静态配置数据的读取模块 都可以放到 M2 上面。比如月统计报表,比如首页推荐商品 业务实时性要求不是很高,完全可以采用这种弱一致性的设 计架构模式。 中间一致性 如果既不是很强的一致性又不是很弱的一致性,那 么我们就采取中间的策略,就是在同机房再部署一个 S1(R) 尽量不用触发器,特别是在大数据表上 应用优化 应用优化 编写高效的 编写高效的 SQL SQL (三) (三) 更新触发器如果不是所有情况下都需要触发,应根据业务需要加 更新触发器如果不是所有情况下都需要触发,应根据业务需要加 上必要判断条件 上必要判断条件 使用 使用 union all union all 操作代替 操作代替0 码力 | 38 页 | 2.04 MB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.1=\d{3}$)/g, ',') console.log(result); // => "12345,678" 其中,(?=\d{3}$) 匹配 \d{3}$ 前面的位置。而 \d{3}$ 匹配的是目标字符串最后那 3 位数字。 2.4.2.2. 弄出所有的逗号 因为逗号出现的位置,要求后面 3 个数字一组,也就是 \d{3} 至少出现一次。 此时可以使用量词 +: var result = 假设我们的正则是 /ab{1,3}c/,其可视化形式是: 而当目标字符串是 "abbbc" 时,就没有所谓的“回溯”。其匹配过程是: JavaScript 正则表达式迷你书 4. 第四章 正则表达式回溯法原理 | 第 38 页 其中子表达式 b{1,3} 表示 "b" 字符连续出现 1 到 3 次。 4.2. 有回溯的匹配 如果目标字符串是"abbc",中间就有回溯。 图中第 5 步有红颜色,表示匹配不成功。此时 第 6 步与第 4 步一样),最后再用子表达式 c,去匹配字符 "c"。当然,此时整个表达式匹配成功了。 图中的第 6 步,就是“回溯”。 你可能对此没有感觉,这里我们再举一个例子。正则是: 目标字符串是"abbbc",匹配过程是: JavaScript 正则表达式迷你书 4. 第四章 正则表达式回溯法原理 | 第 39 页 其中第 7 步和第 10 步是回溯。第 7 步与第 4 步一样,此时0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0=\d{3}$)/g, ',') console.log(result); // => "12345,678" 其中,(?=\d{3}$) 匹配 \d{3}$ 前面的位置。而 \d{3}$ 匹配的是目标字符串最后那 3 位数字。 2.4.2.2. 弄出所有的逗号 因为逗号出现的位置,要求后面 3 个数字一组,也就是 \d{3} 至少出现一次。 此时可以使用量词 +: var result = 假设我们的正则是 /ab{1,3}c/,其可视化形式是: 而当目标字符串是 "abbbc" 时,就没有所谓的“回溯”。其匹配过程是: JavaScript 正则表达式迷你书 4. 第四章 正则表达式回溯法原理 | 第 38 页 其中子表达式 b{1,3} 表示 "b" 字符连续出现 1 到 3 次。 4.2. 有回溯的匹配 如果目标字符串是"abbc",中间就有回溯。 图中第 5 步有红颜色,表示匹配不成功。此时 第 6 步与第 4 步一样),最后再用子表达式 c,去匹配字符 "c"。当然,此时整个表达式匹配成功了。 图中的第 6 步,就是“回溯”。 你可能对此没有感觉,这里我们再举一个例子。正则是: 目标字符串是"abbbc",匹配过程是: JavaScript 正则表达式迷你书 4. 第四章 正则表达式回溯法原理 | 第 39 页 其中第 7 步和第 10 步是回溯。第 7 步与第 4 步一样,此时0 码力 | 89 页 | 3.42 MB | 11 月前3
共 14 条
- 1
- 2













