清华大学 DeepSeek 从入门到精通长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务0 码力 | 103 页 | 5.40 MB | 8 月前3
Ubuntu 桌面培训 2010ubuntu.com/ 技术型用户如果您具有一定的技术水平,可以选择以下的方式为 Ubuntu 做出贡献: • 测试 Ubuntu 预发布版并从中寻找缺陷。 • 报告缺陷,帮助开发团队对其进行分析。 • 对错误报告进行筛选,并加以必要的编辑、评估和分类,便于更快地解决问题。 • 加入并参与 Ubuntu 的支持邮件列表或讨论列表。 12 Ubuntu 和 Microsoft Windows:对比 对话框中,有三个预定义的特效级别:无、正常和扩展,您可以从其 中选择一个。 探索 Ubuntu 桌面 53 Ubuntu 桌面培训 目录 图 II.36 配 置 视 觉 效 果 如果您想要一个没有任何特效的普通桌面,选择无。如果您想要一个在性能和外观之 间平衡的桌面,选择正常。如果您想要更丰富的桌面效果,比如窗口抖动、桌面立方 体等等,选择扩展。比如说窗口抖动效果,在您等待更新完成或者邮件客户端收取邮 邮件复选框。在分钟框中指 定间隔的长度。 b. 在服务器上保留在消息存储节中,如果想在服务器上保留消息,选中在服务器 上保留信件复选框。 c. 如果您要禁用 POP3,请选中禁用所有 POP3 扩展支持。 d. 点击前进。 使用互联网 85 Ubuntu 桌面培训 目录 图 III.29 指 定 邮 件 检 查 和 储 存 选 项 6. 在发送电子邮件页,根据发送邮件消息想使用的方法指定信息。在服务器类型框中0 码力 | 540 页 | 26.26 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化,0 码力 | 85 页 | 8.31 MB | 8 月前3
Kubernetes Operator 实践 - MySQL容器化中一切都可视为资源 • 默认资源类型:如 Pod、Service、Volume 等 • Kubernetes 1.7 之后增加了 CRD 自定义资源 • 二次开发扩展 Kubernetes API CRD 的基本原理 ① 观察资源的当前状态 ② 分析当前状态与期望状态的差别 ③ 调用 API 消除差别 TestCluster app=test app=test 申请扩容 期望副本数:3 当前副本数:10 码力 | 42 页 | 4.77 MB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.11.4. 多选分支 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.5. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.1. 匹配 16 进制颜色值 48 5.2.3 元字符转义问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.3. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.3.1 身份证. . . . 然而关于正则如何匹配字符的学习,大部分人都觉得这块比较杂乱。 毕竟元字符太多了,看起来没有系统性,不好记。本章就解决这个问题。 内容包括: • 两种模糊匹配 • 字符组 • 量词 • 分支结构 • 案例分析 1.1. 两种模糊匹配 如果正则只有精确匹配是没多大意义的,比如 /hello/,也只能匹配字符串中的 "hello" 这个子串。 var regex = /hello/; console.log(0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.01.4. 多选分支 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.5. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.1. 匹配 16 进制颜色值 48 5.2.3 元字符转义问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.3. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.3.1 身份证. . . . 然而关于正则如何匹配字符的学习,大部分人都觉得这块比较杂乱。 毕竟元字符太多了,看起来没有系统性,不好记。本章就解决这个问题。 内容包括: • 两种模糊匹配 • 字符组 • 量词 • 分支结构 • 案例分析 1.1. 两种模糊匹配 如果正则只有精确匹配是没多大意义的,比如 /hello/,也只能匹配字符串中的 "hello" 这个子串。 var regex = /hello/; console.log(0 码力 | 89 页 | 3.42 MB | 11 月前3
MySQL 8.0.17 调优指南(openEuler 20.09)要有以下几个方面: ● 对性能进行分析时,要多方面分析系统的资源瓶颈所在,因为系统某一方面性能 低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性能的某方面的一个参数进行调整,多个参数同时调整的话,很难 界定性能的影响是由哪个参数造成的。 ● 由于在进行系统性能分析时,性能分析工具本身会占用一定的系统资源,如CPU ,如CPU 资源、内存资源等等。我们必须注意到这点,即分析工具本身运行可能会导致系 统某方面的资源瓶颈情况更加严重。 MySQL 8.0.17 调优指南(openEuler 20.09) 1 调优概述 2020-10-15 1 ● 必须保证调优后的程序运行正确。 ● 调优过程是迭代渐进的过程,每一次调优的结果都要反馈到后续的代码开发中 去。 ● 性能调优不能以牺牲代码的可读性和可维护性为代价。 代价。 1.3 调优思路 性能优化首先要较为精准的定位问题,分析系统性能瓶颈,然后根据其性能指标以及 所处层级选择优化的方式方法。 下面介绍MySQL数据库具体的调优思路和分析过程,如图1所示。 调优分析思路如下: 1. 很多情况下压测流量并没有完全进入到服务端,在网络上可能就会出现由于各种 规格(带宽、最大连接数、新建连接数等)限制,导致压测结果达不到预期。 2. 接着看关键指标是否0 码力 | 11 页 | 223.31 KB | 1 年前3
谈谈MYSQL那点事MySQL MySQL 技巧分 技巧分 享 享 MySQL MySQL 技巧分享 技巧分享 常用技巧 常用技巧 使用 使用 Explain/ DESC Explain/ DESC 来分析 来分析 SQL SQL 的执行情况 的执行情况 使用 使用 SHOW PROCESSLIST SHOW PROCESSLIST 来查看当前 来查看当前 MySQL MySQL 服务器线 服务器线 MySQL Slow Log 分析工具 分析工具 mysqldumpslow - mysql mysqldumpslow - mysql 官方提供的慢查询日志分析 官方提供的慢查询日志分析 工具 工具 mysqlsla - hackmysql.com mysqlsla - hackmysql.com 推出的一款日志分析工具 推出的一款日志分析工具 ,功能 ,功能0 码力 | 38 页 | 2.04 MB | 1 年前3
2022 Apache Ozone 的最近进展和实践分享是否可以扩展⾄数百PB的存储容量,数千个 物理节点以及数⼗亿个对象 扩展性 API 兼容性 性能 是否⽀持存算分离架构同时也可以兼容存算耦合 架构 应⽤对接 安全 加密 HDFS现有的⼀些解决⽅案 Namenode Federation Router Based Federation 是否需要⼀个新的⼤数据存储? 现有的对象存储⽅案 ⽆法很好的横向扩展 HDFS的扩展性 达到了上限 Apache Ozone适⽤场景 • Apache Ozone的最近进展 • Apache Ozone的实践分享 Apache Ozone • Ozone是 ⼀个分布式的KV对象存储 可扩展⾄数⼗亿个对象,从⽽对云原⽣类的应⽤更友好 强⼀致性 与HDFS 和 S3 API兼容 可在存储密集型设备中部署进⽽极⼤的减少设备开⽀ Apache Ozone – 数据存储的路径设计 Ozone的存储路径为 AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OTHER WORKLOADS OTHER WORKLOADS X • 可⽤于承载实时和批处理的业务 • 扩展性提升 • ⽆需改变或改造业务应⽤代码 • 降低控制平⾯的节点数和服务依赖 业务价值 • 降低⼤规模集群的运维难度 • 可通过HDFS API和Distcp进⾏快速迁移 • 降低系统恢复时间0 码力 | 35 页 | 2.57 MB | 1 年前3
RocketMQ v3.2.4 开发指南com/alibaba/RocketMQ 6 (4). 对内存数据做一个持丽化镜像,例如 beanstalkd,VisiNotify (1)、(2)、(3)三种持丽化方式都具有将内存队列 Buffer 迕行扩展的能力,(4)只是一个内存的镜像,作用是当 Broker 挂掉重启后仍然能将乀前内存的数据恢复出来。 JMS 不 CORBA Notification 规范没有明确说明如何持丽化,但是持丽化部分的性能直接决定了整个消息中间件 项目开源主页:https://github.com/alibaba/RocketMQ 11 队列集合。 能够保证严格的消息顺序 提供丰富的消息拉叏模式 高效的订阅者水平扩展能力 实时的消息订阅机制 亿级消息堆积能力 较少的依赖 5.2 RocketMQ 物理部署结构 Name Server集群 Broker Master1 Broker com/alibaba/RocketMQ 24 如图所示,5 个队列可以部署在一台机器上,也可以分别部署在 5 台丌同的机器上,収送消息通过轮询队列的方式 収送,每个队列接收平均的消息量。通过增加机器,可以水平扩展队列容量。 另外也可以自定丿方式选择収往哪个队列。 7.9 订阅消息负载均衡 TOPIC_A Consumer1 Consumer2 7-6 订阅消息 Rebalance0 码力 | 52 页 | 1.61 MB | 1 年前3
共 14 条
- 1
- 2













