清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 型 进 行 最 终 的 强 化 学 习 , 以 对 齐 人 类 偏好。 降本提能:架构创新,技术增效 DeepSeek通过架构创新和模型蒸馏技术,在提升模型性能的同时,显著降低计算成本和内存占用。这些技术不仅在 长文本处理、代码生成、数学推理等任务中表现出色,还为大模型的轻量化和实际应用提供了有力支持。 模型蒸馏技术 DeepSeek采用模型蒸馏技术,通过将知识从大型复杂模型 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 内存和计算开销,在推理中降低了 KV缓存占用空间。 多头潜在注意力(MLA)机制 通过序列化预测未来多个令牌,增强 模型的上下文建模能力,并支持推测 解码加速推理。MTP在特定场景下同0 码力 | 85 页 | 8.31 MB | 8 月前3
消息中间件RocketMQ原理解析 - 斩秋流量控制,正在消费队列中消息的跨度超过阀值(默认 2000),稍后在消费 5. 根据 topic 获取订阅关系 6. 构建拉消息回调对象 PullBack, 从 broker 拉取消息(异步拉取)返回结果是回调 7. 从内存中获取 commitOffsetValue //TODO 这个值跟 pullRequest.getNextOffset 区别 8. 构建 sysFlag pull 接口用到的 flag 9 但是消费消息的时候一旦遇到消费消息失败直接放回,根据 ackIndex 来标记 成功消费到哪里了 消费失败, ackIndex 设置为-1 广播模式发送失败的消息丢弃, 广播模式对于失败重试代价过高,对整个集 群性能会有较大影响,失败重试功能交由应用处理 集群模式, 将消费失败的消息一条条的发送到 broker 的重试队列中去,如果 此时还有发送到重试队列发送失败的消息,那就在 cosumer 的本地线程定时 5 秒钟以后重试重新消费消息, 在走一次上面的消费流程。 删除正在消费的队列 processQueue 中本次消费的消息,放回消费进度 更新消费进度, 这里的更新只是一个内存 offsetTable 的更新,后面有定时任务定 时更新到 broker 上去 五:push 消费-顺序消费消息0 码力 | 57 页 | 2.39 MB | 1 年前3
谈谈MYSQL那点事查询 查询 事务管理 事务管理 数据库设计 数据库设计 数据分布 数据分布 网络 网络 操作系统 操作系统 硬件 硬件 使用好的硬件,更快的硬盘、大内存、多核 使用好的硬件,更快的硬盘、大内存、多核 CPU CPU ,专业的 ,专业的 存储服务器( 存储服务器( NAS NAS 、 、 SAN SAN ) ) 设计合理架构,如果 设计合理架构,如果 MySQL 不同引擎进行不同定制 性配置 性配置 针对不同的应用情况进行合理配置 针对不同的应用情况进行合理配置 针对 针对 my.cnf my.cnf 进行配置,后面设置是针对内存为 进行配置,后面设置是针对内存为 16G 16G 的服务器进行的合理设置 的服务器进行的合理设置 服务优化 服务优化 MySQL MySQL 配置原则 配置原则 服务优化 服务优化 公共选项 公共选项 query_cache_size 0 ( 不打开 ) 128M 查询缓存区的最大长度,按照当前需求,一 倍一倍增加,本选项比较重要 sort_buffer_size 512K 128M 每个线程的排序缓存大小,一般按照内存可 以设置为 2M 以上,推荐是 16M ,该选项对 排序 order by , group by 起作用 record_buffer 128K 64M 每个进行一个顺序扫描的线程为其扫描的每 张表分配这个大小的一个缓冲区,可以设置0 码力 | 38 页 | 2.04 MB | 1 年前3
MySQL 8.0.17 调优指南(openEuler 20.09)低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性能的某方面的一个参数进行调整,多个参数同时调整的话,很难 界定性能的影响是由哪个参数造成的。 ● 由于在进行系统性能分析时,性能分析工具本身会占用一定的系统资源,如CPU 资源、内存资源等等。我们必须注意到这点,即分析工具本身运行可能会导致系 统某方面的资源瓶颈情况更加严重。 :等待事件、内存命 中率等。 5. 如果以上指标都正常,应用程序的算法、缓冲、缓存、同步或异步可能有问题, 需要具体深入的分析。 瓶颈点 说明 硬件/规格 一般指的是CPU、内存、磁盘I/O方面的问题,分为服务器硬件瓶 颈、网络瓶颈(对局域网可以不考虑)。 操作系统 一般指的是Windows、UNIX、Linux等操作系统。例如,在进行性 能测试,出现物理内存不足时,虚拟内存设置也不合理,虚拟内 缓存参数调优 目的 对于不同系统的内存使用情况,通过在OS层面调整一些缓存相关参数配置,可以有效 提升服务器性能。 MySQL 8.0.17 调优指南(openEuler 20.09) 3 操作系统调优 2020-10-15 7 方法 Linux参数 参数含义 操作 swappiness 值越大,越积极使用swap分 区,值越小,越积极使用内存。 执行命令vi /etc/sysctl0 码力 | 11 页 | 223.31 KB | 1 年前3
Ubuntu 桌面培训 2010由于游戏需要从不同的地方下载,因此了解软件仓库的概念非常重要。您可能需要复 述第一节课中关于启用软件仓库的主题。您还需要提前在每台机器上安装好本节课内 容中所涉及到的两个游戏,否则安装游戏将有可能占用过多的课堂时间。 注: 启用一个软件仓库是一项一次性的操作。您不必在每次安装软件之前启用该软件仓 库。 V.I.I 从软件仓库中安装一个游戏 Ubuntu 软件中心和新立得软件包管理器是图形化用户界面(GUI)工具,允许您方便地 GIMP有很多有用的功能: • 全套的涂画工具,包括油漆桶填充、铅笔和喷枪等 • 选择工具包括矩形选择、椭圆选择、自由选择、前景选择和模糊选择等 • 变换工具包括旋转、缩放、剪切和翻转等 • 平铺式的内存管理,使图像的大小只受限于可用磁盘空间 • 只受磁盘空间限制的多次撤销和重做 • 高级脚本功能 • 图层和用于复杂绘图的通道 • 所有绘图工具中都有子像素取样,它能够降低在低分辨率手段显示高分辨率影像时 刻录完成后,CD 音频曲目现在复制为了硬盘上的音频文件。通过双击曲目便可播 放。 练习 3:刻录音频 CD 您最近发现了一个可以免费下载歌曲的网站而您又不想这些文 件占用计算机硬盘上宝贵的空间。于是您想要复制这些文件到音频 CD 上,以便将来 欣赏它们而不占用硬盘空间。 1. 向计算机的光驱插入一张空白(可刻录的) CD。 2. 点击制作音频 CD 按钮,启动 Brasero 光盘刻录程序。 3. 点击新建音频项目按钮。0 码力 | 540 页 | 26.26 MB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.1试过的状态,以便后续回溯时使用。注定要占用一定的内存 JavaScript 正则表达式迷你书 6. 第六章 正则表达式的构建 | 第 60 页 。 此时要使用具体化的字符组,来代替通配符.,以便消除不必要的字符,此时使用正则 /"[^"]*"/,即可。 6.4.2. 使用非捕获型分组 因为括号的作用之一是,可以捕获分组和分支里的数据。那么就需要内存来保存它们。 当我们不需要使用分组引0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0试过的状态,以便后续回溯时使用。注定要占用一定的内存 JavaScript 正则表达式迷你书 6. 第六章 正则表达式的构建 | 第 60 页 。 此时要使用具体化的字符组,来代替通配符.,以便消除不必要的字符,此时使用正则 /"[^"]*"/,即可。 6.4.2. 使用非捕获型分组 因为括号的作用之一是,可以捕获分组和分支里的数据。那么就需要内存来保存它们。 当我们不需要使用分组引0 码力 | 89 页 | 3.42 MB | 11 月前3
RocketMQ v3.2.4 开发指南...................................................................... 25 7.14 单个 JVM 迕程也能利用机器超大内存 .................................................................................................. 通信而言。在此丌再详述。 4.2 Message Priority 规范中描述的优兇级是挃在一个消息队列中,每条消息都有丌同的优兇级,一般用整数来描述,优兇级高的消 息兇投递,如果消息完全在一个内存队列中,那举在投递前可以挄照优兇级排序,令优兇级高的兇投递。 由亍 RocketMQ 所有消息都是持丽化的,所以如果挄照优兇级来排序,开销会非常大,因此 RocketMQ 没有特 意支持消息优 项目开源主页:https://github.com/alibaba/RocketMQ 6 (4). 对内存数据做一个持丽化镜像,例如 beanstalkd,VisiNotify (1)、(2)、(3)三种持丽化方式都具有将内存队列 Buffer 迕行扩展的能力,(4)只是一个内存的镜像,作用是当 Broker 挂掉重启后仍然能将乀前内存的数据恢复出来。 JMS 不 CORBA Notification 规范没有0 码力 | 52 页 | 1.61 MB | 1 年前3
2022 Apache Ozone 的最近进展和实践分享) 当前 - 每个Container的元数据保存在独⽴RocksDB实例中 单盘单RocksDB实例 问题 • ⼤容量磁盘,系统中有上万个Container和 RocksDB实例 • 内存开销⼤,需保留众多RocksDB实例 • 性能影响,频繁open/close实例 • 磁盘使⽤量,不可精准预测 • 稳定性,频繁open/close⾮RocksDB的推荐⽤法, 容易触发潜在问题0 码力 | 35 页 | 2.57 MB | 1 年前3
共 9 条
- 1













