 新一代云原生分布式存储新一代云原生分布式存储—Curve 上 李小翠 网易数帆存储团队分布式存储介绍 01 存储的发展 | 分布式存储的分类 | 分布式存储的要素 02 03 04 Ceph 架构简介 | 场景介绍 | 使用中的问题 Curve 架构简介 | 数据对比 | 应用情况 FAQ 答疑存储的发展 互联网时代,数据大爆炸 大型主机 成本高 单点问题 扩容困难 各存储设备通过网络互联 各存储设备通过网络互联 大规模 弹性扩容 底层构建在分布式存储之上 云的概念 成本:共用基础设施 弹性:随意扩缩容 速度:更快的构建发布业务 底层构建在分布式存储之上 云原生的概念: 易用性:跨平台,超融合,弹性 小型主机 容量有限分布式存储的分类 按照各种应用场景所需的存储接口分类 对象 存储 文件 存储 块存储 接口为简单的 Get、PUT、DEL 和其他扩展 对指定地址空间进行随机读写 传统意义的块存储:磁盘分布式存储的要素 如何构建分布式文件系统? 以分布式块存储为例。 •提供大容量的块设备 •可以在指定地址空间内随机读写 write(offset, len) •服务质量要求:数据不能丢、服务随时可用、弹性扩缩容 要什么 •成百上千台存储节点 •磁盘故障、机器故障、网络故障概率性发生 有什么 分布式存储系统需要满足接口需求,并且有持续监控、错误检测、容错与自动恢复的能力0 码力 | 29 页 | 2.46 MB | 6 月前3 新一代云原生分布式存储新一代云原生分布式存储—Curve 上 李小翠 网易数帆存储团队分布式存储介绍 01 存储的发展 | 分布式存储的分类 | 分布式存储的要素 02 03 04 Ceph 架构简介 | 场景介绍 | 使用中的问题 Curve 架构简介 | 数据对比 | 应用情况 FAQ 答疑存储的发展 互联网时代,数据大爆炸 大型主机 成本高 单点问题 扩容困难 各存储设备通过网络互联 各存储设备通过网络互联 大规模 弹性扩容 底层构建在分布式存储之上 云的概念 成本:共用基础设施 弹性:随意扩缩容 速度:更快的构建发布业务 底层构建在分布式存储之上 云原生的概念: 易用性:跨平台,超融合,弹性 小型主机 容量有限分布式存储的分类 按照各种应用场景所需的存储接口分类 对象 存储 文件 存储 块存储 接口为简单的 Get、PUT、DEL 和其他扩展 对指定地址空间进行随机读写 传统意义的块存储:磁盘分布式存储的要素 如何构建分布式文件系统? 以分布式块存储为例。 •提供大容量的块设备 •可以在指定地址空间内随机读写 write(offset, len) •服务质量要求:数据不能丢、服务随时可用、弹性扩缩容 要什么 •成百上千台存储节点 •磁盘故障、机器故障、网络故障概率性发生 有什么 分布式存储系统需要满足接口需求,并且有持续监控、错误检测、容错与自动恢复的能力0 码力 | 29 页 | 2.46 MB | 6 月前3
 Curve 分布式存储设计Curve 分布式存储设计 程义 — Curve Maintainer XAgenda 第二 第三 第四 第一 Curve的由来 Curve的设计目标 Curve块存储 和 Curve文件存储 Curve社区Curve的由来 1. 代码复杂/代码量大 2. 运维难度高 3. 无法满足高的性能需求Curve的设计目标 1. Curve云原生软件定义存储 2. Curve块存储 4. 高性能,易运维,云原生Curve块存储 1. 高性能分布式共享数据库场景 2. Curve块存储提供底层分布式共享存储 3. Polardb for PostgreSQL提供上层高性能数 据库服务 4. 性能测试 1. benchmarkSQL 每分钟事务数提升39% 2. pgbench 延迟降低21% TPS提升26% 研究现状Curve块存储 1. 分布式块存储服务 iSCSI协议 4. 容器云块存储(CSI) 应用场景Curve块存储 1. 高可用性/高可靠性 (易运维) 2. RAFT一致性协议 3. CopySet分配算法 4. 拓扑结构 5. 高性能 6. chunkfilepool (降低写放大) 7. data stripe (增大并发) 8. zerocopy 9. 云原生 核心设计Curve块存储 1. physical pool用于实现对机0 码力 | 20 页 | 4.13 MB | 6 月前3 Curve 分布式存储设计Curve 分布式存储设计 程义 — Curve Maintainer XAgenda 第二 第三 第四 第一 Curve的由来 Curve的设计目标 Curve块存储 和 Curve文件存储 Curve社区Curve的由来 1. 代码复杂/代码量大 2. 运维难度高 3. 无法满足高的性能需求Curve的设计目标 1. Curve云原生软件定义存储 2. Curve块存储 4. 高性能,易运维,云原生Curve块存储 1. 高性能分布式共享数据库场景 2. Curve块存储提供底层分布式共享存储 3. Polardb for PostgreSQL提供上层高性能数 据库服务 4. 性能测试 1. benchmarkSQL 每分钟事务数提升39% 2. pgbench 延迟降低21% TPS提升26% 研究现状Curve块存储 1. 分布式块存储服务 iSCSI协议 4. 容器云块存储(CSI) 应用场景Curve块存储 1. 高可用性/高可靠性 (易运维) 2. RAFT一致性协议 3. CopySet分配算法 4. 拓扑结构 5. 高性能 6. chunkfilepool (降低写放大) 7. data stripe (增大并发) 8. zerocopy 9. 云原生 核心设计Curve块存储 1. physical pool用于实现对机0 码力 | 20 页 | 4.13 MB | 6 月前3
 openEuler 22.03 LTS SP2 技术白皮书openEuler 22.03 LTS SP2 技术白皮书 平台架构 openEuler 是覆盖全场景的创新平台,在引领内核创新,夯实云化基座的基础上,面向计算架构互联总线、存储介质 发展新趋势,创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基 础设施的开源操作系统。 openEuler 22.03 LTS SP2 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 5.10 构建,对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 22.03 LTS SP2 版本集成分布式软总线、 KubeEdge+ 边云协同框架等能力,进一步提升数字基础设施协同能力,构建万物互联的基础。 面向未来,社区将持续创新、社区共建、繁荣生态,夯实数字基座。 夯实云化基座 • 容器操作系统 场景创新 openEuler发布面向嵌入式领域的版本openEuler 22.03 LTS SP2 Embedded,提供更加丰富的嵌入式软件包构建能力, 支持实时 / 非实时平面混合关键部署,并集成分布式软总线。 openEuler Embedded 围绕工业和机器人领域持续深耕,通过行业项目垂直打通,不断完善和丰富嵌入式技术栈和 生态。openEuler 22.03 LTS SP2 Embedded0 码力 | 48 页 | 5.62 MB | 1 年前3 openEuler 22.03 LTS SP2 技术白皮书openEuler 22.03 LTS SP2 技术白皮书 平台架构 openEuler 是覆盖全场景的创新平台,在引领内核创新,夯实云化基座的基础上,面向计算架构互联总线、存储介质 发展新趋势,创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基 础设施的开源操作系统。 openEuler 22.03 LTS SP2 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 5.10 构建,对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 22.03 LTS SP2 版本集成分布式软总线、 KubeEdge+ 边云协同框架等能力,进一步提升数字基础设施协同能力,构建万物互联的基础。 面向未来,社区将持续创新、社区共建、繁荣生态,夯实数字基座。 夯实云化基座 • 容器操作系统 场景创新 openEuler发布面向嵌入式领域的版本openEuler 22.03 LTS SP2 Embedded,提供更加丰富的嵌入式软件包构建能力, 支持实时 / 非实时平面混合关键部署,并集成分布式软总线。 openEuler Embedded 围绕工业和机器人领域持续深耕,通过行业项目垂直打通,不断完善和丰富嵌入式技术栈和 生态。openEuler 22.03 LTS SP2 Embedded0 码力 | 48 页 | 5.62 MB | 1 年前3
 Curve设计要点新一代分布式存储系统 Curve 李小翠Curve 是高性能、高可用、高可靠的分布式存储系统 • 高性能、低延迟 • 可支撑储场景:块存储、对象存储、云原生数据库、EC等 • 当前实现了高性能块存储,对接OpenStack和 K8s 网易内部线上无故障稳定运行一年多,线上异常演练 • 已开源 • github主页: https://opencurve.github.io/ • github代码仓库: 多个存储软件:SDFS、NEFS、NBS • 已有的开源软件:Ceph • 不能胜任性能、延迟敏感的场景 • 异常场景抖动较大(比如慢盘场景) • 去中心节点设计在集群不均衡的情况下需要人工运维 • 基于通用分布式存储构建上层存储服务背景 01 02 03 04 总体设计 系统特性 近期规划基本架构 • 元数据节点 MDS 管理元数据信息 收集集群状态信息,自动调度基本架构 • 元数据节点 MDS 1.244 3.2 3.1 0.998 4K随机写 4K随机读 61.12 % 67.8% 测试环境:6台服务器*20块SATA SSD,E5-2660 v4,256G,3副本场景 高性能高性能 • quorum机制:raft • 轻量级快照 • io路径上的优化 • filepool落盘零放大 • 轻量级线性一致性读 • io路径上用户空间零拷贝 10卷4K随机读写IOPS0 码力 | 35 页 | 2.03 MB | 6 月前3 Curve设计要点新一代分布式存储系统 Curve 李小翠Curve 是高性能、高可用、高可靠的分布式存储系统 • 高性能、低延迟 • 可支撑储场景:块存储、对象存储、云原生数据库、EC等 • 当前实现了高性能块存储,对接OpenStack和 K8s 网易内部线上无故障稳定运行一年多,线上异常演练 • 已开源 • github主页: https://opencurve.github.io/ • github代码仓库: 多个存储软件:SDFS、NEFS、NBS • 已有的开源软件:Ceph • 不能胜任性能、延迟敏感的场景 • 异常场景抖动较大(比如慢盘场景) • 去中心节点设计在集群不均衡的情况下需要人工运维 • 基于通用分布式存储构建上层存储服务背景 01 02 03 04 总体设计 系统特性 近期规划基本架构 • 元数据节点 MDS 管理元数据信息 收集集群状态信息,自动调度基本架构 • 元数据节点 MDS 1.244 3.2 3.1 0.998 4K随机写 4K随机读 61.12 % 67.8% 测试环境:6台服务器*20块SATA SSD,E5-2660 v4,256G,3副本场景 高性能高性能 • quorum机制:raft • 轻量级快照 • io路径上的优化 • filepool落盘零放大 • 轻量级线性一致性读 • io路径上用户空间零拷贝 10卷4K随机读写IOPS0 码力 | 35 页 | 2.03 MB | 6 月前3
 Linux命令大全搜索工具 v1.8比grep好用的文本搜索工具 alias 定义或显示别名 apachectl Apache服务器前端控制工具 apk Alpine Linux 下的包管理工具 apropos 在 whatis 数据库中查找字符串 apt-get Debian Linux发行版中的APT软件包管理工具 apt-key 管理Debian Linux系统中的软件包密钥 apt-sortpkgs Debian L diffstat 显示diff命令输出信息的柱状图 dig 域名查询工具 dircolors 置ls命令在显示目录或文件时所用的色彩 dirname 去除文件名中的非目录部分 dirs 显示目录堆栈 disown 从当前的shell中移除作业 dmesg 显示Linux系统启动信息 dmidecode 在Linux系统下获取有关硬件方面的信息 dnf 新一代的RPM软件包管理器 dnsdomainname 获取Linux内核模块的详细信息 getenforce 显示当前SELinux的应用模式,是强制、执行还是停用 getsebool 查询SElinux策略内各项规则的布尔值 git 是目前世界上最先进的分布式版本控制系统 gpasswd Linux下工作组文件的管理工具 gpm 提供文字模式下的滑鼠事件处理 grep 强大的文本搜索工具 groupadd 用于创建一个新的工作组 groupdel0 码力 | 1347 页 | 8.79 MB | 1 年前3 Linux命令大全搜索工具 v1.8比grep好用的文本搜索工具 alias 定义或显示别名 apachectl Apache服务器前端控制工具 apk Alpine Linux 下的包管理工具 apropos 在 whatis 数据库中查找字符串 apt-get Debian Linux发行版中的APT软件包管理工具 apt-key 管理Debian Linux系统中的软件包密钥 apt-sortpkgs Debian L diffstat 显示diff命令输出信息的柱状图 dig 域名查询工具 dircolors 置ls命令在显示目录或文件时所用的色彩 dirname 去除文件名中的非目录部分 dirs 显示目录堆栈 disown 从当前的shell中移除作业 dmesg 显示Linux系统启动信息 dmidecode 在Linux系统下获取有关硬件方面的信息 dnf 新一代的RPM软件包管理器 dnsdomainname 获取Linux内核模块的详细信息 getenforce 显示当前SELinux的应用模式,是强制、执行还是停用 getsebool 查询SElinux策略内各项规则的布尔值 git 是目前世界上最先进的分布式版本控制系统 gpasswd Linux下工作组文件的管理工具 gpm 提供文字模式下的滑鼠事件处理 grep 强大的文本搜索工具 groupadd 用于创建一个新的工作组 groupdel0 码力 | 1347 页 | 8.79 MB | 1 年前3
 CloudExplorer 3.0 管理员手册v1.2Web 控制台的账号,以及用于给应用通过 API 操作云平台需要的授权云平台 API 账号。 项目生命周期 指项目从开发测试、投产到系统运维、应用运维的整个过程。 应用系统 由多个应用组成的分布式系统。 应用 指独立部署运行的应用程序。 应用运行环境 支持应用系统运行的各类资源和环境,包括各类基础架构平台的虚拟机、 操作系统、云磁盘、网络、安全组、弹性 IP,负载均衡、RDS、对象存储、 久性,以及稳定的低时延性能。您可以对云硬盘做格式化、创建文件系统 等操作,并对数据做持久化存储 安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于设置云服 务器、负载均衡、云数据库等实例的网络访问控制,控制实例级别的出入 流量,是重要的网络安全隔离手段。可以通过配置安全组规则,允许或禁 止安全组内的实例的出流量和入流量。 弹性 IP 是私有云、公有云中租户能够申请获取保留专用的公网 的可扩展和高可用,公有云厂商会保证这一点,只有出费用,多少都能存。 PaaS 是指云服务中的平台即服务,这个概念的业界定义和理解不是很统一,并 且比较混淆。我们简化一些,指公有云中的 RDS 等中间件、数据库在线服 务,以及容器云。 VLAN Virtual Local Area Network, 虚拟局域网, 是建立在物理网络基础上的一 种逻辑子网,用于隔离多个主机组之前的网络访问。物理位置不同的多个0 码力 | 308 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 管理员手册v1.2Web 控制台的账号,以及用于给应用通过 API 操作云平台需要的授权云平台 API 账号。 项目生命周期 指项目从开发测试、投产到系统运维、应用运维的整个过程。 应用系统 由多个应用组成的分布式系统。 应用 指独立部署运行的应用程序。 应用运行环境 支持应用系统运行的各类资源和环境,包括各类基础架构平台的虚拟机、 操作系统、云磁盘、网络、安全组、弹性 IP,负载均衡、RDS、对象存储、 久性,以及稳定的低时延性能。您可以对云硬盘做格式化、创建文件系统 等操作,并对数据做持久化存储 安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于设置云服 务器、负载均衡、云数据库等实例的网络访问控制,控制实例级别的出入 流量,是重要的网络安全隔离手段。可以通过配置安全组规则,允许或禁 止安全组内的实例的出流量和入流量。 弹性 IP 是私有云、公有云中租户能够申请获取保留专用的公网 的可扩展和高可用,公有云厂商会保证这一点,只有出费用,多少都能存。 PaaS 是指云服务中的平台即服务,这个概念的业界定义和理解不是很统一,并 且比较混淆。我们简化一些,指公有云中的 RDS 等中间件、数据库在线服 务,以及容器云。 VLAN Virtual Local Area Network, 虚拟局域网, 是建立在物理网络基础上的一 种逻辑子网,用于隔离多个主机组之前的网络访问。物理位置不同的多个0 码力 | 308 页 | 0 Bytes | 1 年前3
 Zabbix 7.0 中文手册. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563 5 网络拓扑图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603 16. 分布式监控 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1862 12 数据库错误处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 1951 页 | 33.43 MB | 1 年前3 Zabbix 7.0 中文手册. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563 5 网络拓扑图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603 16. 分布式监控 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1862 12 数据库错误处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 1951 页 | 33.43 MB | 1 年前3
 openEuler 24.03 LTS 技术白皮书势, 创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基础设施的开源操作系统。 openEuler 24.03 LTS 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 6.6 构建, 对外接口遵循POSIX标准,具备天然协同基础。同时openEuler 24.03 LTS版本集成分布式软总线、KubeEdge+边云协同框架等能力, 器镜像的应用场景如下。 • SDK 镜像:提供对应硬件的计算加速工具包和开发环境,用户可进行 Ascend CANN 或 NVIDIA CUDA 等应用的开发和调试。同时, 可在该类容器中运行高性能计算任务,例如大规模数据处理、并行计算等。 • AI 框架镜像:用户可直接在该类容器中进行 AI 模型开发、训练及推理等任务。 • 模型应用镜像:已预置完整的 AI 软件栈和特定的模型,用户可根 ros-core、ros-base、SLAM 等核心包,并提供 ROS SDK,简化嵌入式 ROS 开发。 3. 软实时内核:提供软实时能力,软实时中断响应时延微秒级。 4. 分布式软总线基础能力:集成 OpenHarmony 的分布式软总线和 hichain 点对点认证模块,实现欧拉嵌入式设备之间互联互通、 欧拉嵌入式设备和 OpenHarmony 设备之间互联互通。 5. 嵌入式容器与边缘:支持0 码力 | 45 页 | 6.18 MB | 1 年前3 openEuler 24.03 LTS 技术白皮书势, 创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基础设施的开源操作系统。 openEuler 24.03 LTS 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 6.6 构建, 对外接口遵循POSIX标准,具备天然协同基础。同时openEuler 24.03 LTS版本集成分布式软总线、KubeEdge+边云协同框架等能力, 器镜像的应用场景如下。 • SDK 镜像:提供对应硬件的计算加速工具包和开发环境,用户可进行 Ascend CANN 或 NVIDIA CUDA 等应用的开发和调试。同时, 可在该类容器中运行高性能计算任务,例如大规模数据处理、并行计算等。 • AI 框架镜像:用户可直接在该类容器中进行 AI 模型开发、训练及推理等任务。 • 模型应用镜像:已预置完整的 AI 软件栈和特定的模型,用户可根 ros-core、ros-base、SLAM 等核心包,并提供 ROS SDK,简化嵌入式 ROS 开发。 3. 软实时内核:提供软实时能力,软实时中断响应时延微秒级。 4. 分布式软总线基础能力:集成 OpenHarmony 的分布式软总线和 hichain 点对点认证模块,实现欧拉嵌入式设备之间互联互通、 欧拉嵌入式设备和 OpenHarmony 设备之间互联互通。 5. 嵌入式容器与边缘:支持0 码力 | 45 页 | 6.18 MB | 1 年前3
 Zabbix 6.0 Manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 580 4 网络拓扑图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 16. 分布式监控 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1721 12 数据库错误处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 1741 页 | 22.78 MB | 1 年前3 Zabbix 6.0 Manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 580 4 网络拓扑图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 16. 分布式监控 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1721 12 数据库错误处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 1741 页 | 22.78 MB | 1 年前3
 openEuler 23.09 技术白皮书发展新趋势,创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基 础设施的开源操作系统。 openEuler 23.09 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 6.4 构 建,对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 23.09 版本集成分布式软总线、KubeEdge+ 接口分配内存时,将不受加速器的物理内存容量所限制,应用可以透明地超分内存(当前上限为 CPU 的 DRAM 容量)。GMEM 将较冷的设备内存页换出到 CPU 内存上,拓展了应用处理的问题规模,实现高性能、低门槛训推。 通过 GMEM 提供的极简异构内存管理框架,在超大模型训练中,GMEM 性能领先 NVIDIA-UVM。随着内存使用量增长,领 先比例不断提升,在超分两倍以上时可领先 NVIDIA-UVM 同步和乒乓,从而提升锁的整体吞吐量,提升业务性能。 • 支持 TCP 压缩:大数据等场景节点间数据传输量大,网络传输是性能瓶颈。在 TCP 层对指定端口的数据进行压缩后 再传输,收包侧把数据解压后再传给用户态,从而提升分布式场景节点间数据传输的效率。 • 热补丁:内核热补丁主要针对内核的函数实现的 bug 进行免重启修复,原理主要在于如何完成动态函数替换, openEuler 上的 livepatch 与 Linux0 码力 | 52 页 | 5.25 MB | 1 年前3 openEuler 23.09 技术白皮书发展新趋势,创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基 础设施的开源操作系统。 openEuler 23.09 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 6.4 构 建,对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 23.09 版本集成分布式软总线、KubeEdge+ 接口分配内存时,将不受加速器的物理内存容量所限制,应用可以透明地超分内存(当前上限为 CPU 的 DRAM 容量)。GMEM 将较冷的设备内存页换出到 CPU 内存上,拓展了应用处理的问题规模,实现高性能、低门槛训推。 通过 GMEM 提供的极简异构内存管理框架,在超大模型训练中,GMEM 性能领先 NVIDIA-UVM。随着内存使用量增长,领 先比例不断提升,在超分两倍以上时可领先 NVIDIA-UVM 同步和乒乓,从而提升锁的整体吞吐量,提升业务性能。 • 支持 TCP 压缩:大数据等场景节点间数据传输量大,网络传输是性能瓶颈。在 TCP 层对指定端口的数据进行压缩后 再传输,收包侧把数据解压后再传给用户态,从而提升分布式场景节点间数据传输的效率。 • 热补丁:内核热补丁主要针对内核的函数实现的 bug 进行免重启修复,原理主要在于如何完成动态函数替换, openEuler 上的 livepatch 与 Linux0 码力 | 52 页 | 5.25 MB | 1 年前3
共 119 条
- 1
- 2
- 3
- 4
- 5
- 6
- 12














 
 