 高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰主负责写和事件分发 • 从负责读 • 底层对接分布式强一致性存储 • CAS 事务写 • 快照读 实现架构图 存储层 存储层 – 分布式 KV Store ByteKV • Multi Raft Goup • 全局有序 Range 分区 • 强一致性 • 支持多 key 事务 • 支持 CAS • 支持快照读 • 高性能 存储层 - 数据格式 etcd KubeBrain • 性能优化 • 落地效果 • 未来演进 性能优化 写优化 - 1 降低锁粒度 存储引擎替换 表锁 -> 行锁,增大了写的并发 写优化 - 2 单点写 -> 多点写 multi raft range 分片,增大写并发 Brain 层无磁盘 io,只有网络 io 写优化 - 3 事务优化 精心设计 key 格式 一个 k8s 对象的索引和数据在同一分区内 跨分区分布式事务 Stream 代替分页,降低延迟 内存高效复用,避免 OOM 读优化 - 2 多分片并发读 通过并发,大大减少读时延 读优化 - 3 读写分离 follower 可以无限扩展,没有 raft 同步问题 读写之间无相互影响 读优化 - 4 Count 优化 基于周期性 Compact 统计,存在内存 降低时延,减轻存储压力 Watch 优化 - 1 写性能提升带来直接收益0 码力 | 60 页 | 8.02 MB | 1 年前3 高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰主负责写和事件分发 • 从负责读 • 底层对接分布式强一致性存储 • CAS 事务写 • 快照读 实现架构图 存储层 存储层 – 分布式 KV Store ByteKV • Multi Raft Goup • 全局有序 Range 分区 • 强一致性 • 支持多 key 事务 • 支持 CAS • 支持快照读 • 高性能 存储层 - 数据格式 etcd KubeBrain • 性能优化 • 落地效果 • 未来演进 性能优化 写优化 - 1 降低锁粒度 存储引擎替换 表锁 -> 行锁,增大了写的并发 写优化 - 2 单点写 -> 多点写 multi raft range 分片,增大写并发 Brain 层无磁盘 io,只有网络 io 写优化 - 3 事务优化 精心设计 key 格式 一个 k8s 对象的索引和数据在同一分区内 跨分区分布式事务 Stream 代替分页,降低延迟 内存高效复用,避免 OOM 读优化 - 2 多分片并发读 通过并发,大大减少读时延 读优化 - 3 读写分离 follower 可以无限扩展,没有 raft 同步问题 读写之间无相互影响 读优化 - 4 Count 优化 基于周期性 Compact 统计,存在内存 降低时延,减轻存储压力 Watch 优化 - 1 写性能提升带来直接收益0 码力 | 60 页 | 8.02 MB | 1 年前3
 Chaos Mesh让应用与混沌在 Kubernetes 上共舞-杨可奥使用起来更加简单 ● SideCar 共享 Network Namespace ○ 范围和权限更加可控 Chaos Mesh 使用案例 以 TiDB 为例 ● 假设 ○ TiDB 使用 Raft 一致性算法构建副本,应当拥有容错的能力 ○ 在杀掉一个节点之后,QPS 应当会下降 ○ 一段时间之后,QPS会恢复正常 ● 运行实验 ○ 使得一个节点无法工作(Pod Failure)0 码力 | 30 页 | 1.49 MB | 9 月前3 Chaos Mesh让应用与混沌在 Kubernetes 上共舞-杨可奥使用起来更加简单 ● SideCar 共享 Network Namespace ○ 范围和权限更加可控 Chaos Mesh 使用案例 以 TiDB 为例 ● 假设 ○ TiDB 使用 Raft 一致性算法构建副本,应当拥有容错的能力 ○ 在杀掉一个节点之后,QPS 应当会下降 ○ 一段时间之后,QPS会恢复正常 ● 运行实验 ○ 使得一个节点无法工作(Pod Failure)0 码力 | 30 页 | 1.49 MB | 9 月前3
 Alluxio 助力 Kubernetes, 加速云端深度学习5/ EOF # One click install $ helm install -f config.yaml alluxio-repo/alluxio --version 2.3.0-SNAPSHOT Alluxio支持AI模型训练场景的挑战 1252.5 2518.8 4981.6 9993.6 1165.6 2221.92 3761.64 2875.2 0 20000 码力 | 22 页 | 11.79 MB | 1 年前3 Alluxio 助力 Kubernetes, 加速云端深度学习5/ EOF # One click install $ helm install -f config.yaml alluxio-repo/alluxio --version 2.3.0-SNAPSHOT Alluxio支持AI模型训练场景的挑战 1252.5 2518.8 4981.6 9993.6 1165.6 2221.92 3761.64 2875.2 0 20000 码力 | 22 页 | 11.79 MB | 1 年前3
共 3 条
- 1













