优化工具 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

TGT服务器的优化

TGT 服务器的优化块设备协议 • NBD • Linux专有块设备协议 • iSCSI • 广泛支持的外部设备协议（块，磁带等）Curve云原生存储支持块设备 • 通过NBD，只支持Linux • 通过SDK API，目前只支持Linux • PFS • 扩大使用范围 • 通过iSCSI支持更多系统，例如Windows, 类UNIX系统等，使用两项基础技术 • TCP/IP 比较久的历史，原来叫STGT，后来改成TGT • 纯用户态，不与内核绑定 • 支持复杂的存储系统，例如ceph rbd, sheepdog, glfs • 纯C代码，外加一些脚本 • 完整的源代码和维护工具、手册 • 编写IO驱动比较容易，容易扩展支持新的存储系统 • 代码独立，容易编译、调试、修改，适应性强让TGT支持curve • 编写curve驱动，底层异步提交I/O，pipeline • 利用NEBD 多个target时，如果挂的设备多，一旦客户端请求量大，就会忙不过来。 • 开源界有尝试修改 • 例如sheepdog的开发者提交过一个patch，但是测试效果不理想，分析原因，event loop依然是瓶颈对TGT的性能优化 • IO是使用多个epoll 线程，充分发挥多CPU能力 • 当前策略是每个target一个epoll线程，负责Initiator发过来的I/O • 好处是各target上的CPU使用由OS负责分配，CPU分配粒度更细

0 码力 | 15 页 | 637.11 KB | 6 月前
3
Curve设计要点

12 % 67.8% 测试环境：6台服务器*20块SATA SSD，E5-2660 v4，256G，3副本场景高性能高性能 • quorum机制：raft • 轻量级快照 • io路径上的优化 • filepool落盘零放大 • 轻量级线性一致性读 • io路径上用户空间零拷贝 10卷4K随机读写IOPS 294k 185k 330k 565k 4K随机写 4K随机读丰富的数据定位问题易运维 • 丰富的metric体系 • prometheus + grafana 可视化 • 每日报表 • 丰富的数据定位问题 • 集群状态查询工具 • curve_ops_tool • 自动化部署工具 • 一键部署，一键升级高质量 • 良好的模块化和抽象设计 • 完善的测试体系 • 单元测试行覆盖80%+，分支覆盖70%+ • 集成测试 Given When 自动化异常测试 41个异常用例 • 自动化大压力随机故障注入 20轮随机故障注入背景 01 02 03 04 总体设计系统特性近期规划• 性能优化 • 满足数据库性能要求 • 大io吞吐优化 • muti raft 性能优化 • 开源 • 系列技术分享 • 参与开发人员线上议题讨论会近期规划欢迎大家参与 C U R V E 项目！ • github主页：

0 码力 | 35 页 | 2.03 MB | 6 月前
3
PFS SPDK: Storage Performance Development Kit

所以不需要元数据高性能，这方面PFS也合适10/17/22 6 对PFS的修改 ●基于阿里开源的PFS ●不再基于daemon模式，而是直接使用pfs core api ●依然向外提供管理工具, 例如 pfs ls、cp、rm等 ●增加spdk驱动10/17/22 7 新增PFS接口 ●增加pfs_pwritev和pfs_preadv接口 ●ssize_t pfs_preadv(int unk pool，为了安全也需要填0。 ●使用nvme的时候，可以直接使用nvme write zero命令，不需要传递大块数据（全是0），减少了nvme传输带宽，而且nvme在垃圾回收上可以优化，例如只是标记某块为0, 而不用实际写，gc时不需要搬运。10/17/22 12 nvme读写的内存对齐要求 ●NVME读写传输描述分两种规格：PRP和SGL。 PRP是第一个版本， SGL是后面才发展起来的总体架构10/17/22 17 TCP也可以部分零copy ●读写盘的部分是零copy的 ●网络部分依赖内核tcp，不是零copy10/17/22 18 进展 ●还在测试CurveBS ●布置、监控等工具需要更新10/17/22 19 性能测试 ●使用pfs daemon测试 ●估计非daemon模式的会更快一点，因为没有跨进程开销10/17/22 20 Write,DMA write,Write-zero测试10/17/22

0 码力 | 23 页 | 4.21 MB | 6 月前
3
CurveFS Copyset与FS对应关系

结论：心跳参考curve。目前这些调度器在curvefs第一阶段不用全部实现。所有和均衡相关的，暂时不做。只做和故障处理相关的副本补全恢复的调度。 6、详细设计 6.1 创建fs curvefs管理工具发起创建fs命令，mds收到createfs命令之后，在mds插入的一条fs记录，状态为NEW。然后为fs创建copyset，默认为3个。mds调用topology的接口找到3个可用的copyset，如果没有足够可用的cop 好了之后，topo中并没有coypset，而是提供接口，随用随创建。copyset选择哪些metaserver的作为3副本的过程，暂时先复用的原来curve块存储创建co pyset的流程，将来再做优化。文件系统的分片，用 partition表示，每个partition由一个copyset管理。每个copyset管理的若干个partition。对应关系如下图所示。© XXX Page 16 of

0 码力 | 19 页 | 383.29 KB | 6 月前
3
Curve核心组件之chunkserver

https://github.com/opencurve/curveCURVE基本架构 01 02 03 04 ChunkServer架构 ChunkServer核心模块新版本ChunkServer性能优化CURVE基本架构 • 元数据节点 MDS • 管理和存储元数据信息 • 感知集群状态，合理调度 • 数据节点 Chunkserver • 数据存储 • 副本一致性，raft • 客户端对元数据增删改查 • 对数据增删改查 • 快照克隆服务器CURVE基本架构 01 02 03 04 ChunkServer架构 ChunkServer核心模块新版本ChunkServer性能优化Curve ChunkServer是数据节点，对外提供数据读写和节点管理功能，底层基于ext4文件系统，操作实际的磁盘。 ChunkServer架构ChunkServer通过RPC网络层与client，盘或者采用其他文件系统，可以在这层进行适配。 ChunkServer架构CURVE基本架构 01 02 03 04 ChunkServer架构 ChunkServer核心模块新版本ChunkServer性能优化ChunkServer核心模块-注册和心跳上报心跳根据心跳下发raft成员变更 ChunkServer注册：chunkserver第一次启动时，需要向mds注册，mds分配并返回 Chun

0 码力 | 29 页 | 1.61 MB | 6 月前
3
Raft在Curve存储中的工程实践

u r v e 存储中的工程实践陈威Curve介绍 01 02 raft和braft 03 raft在Curve中的应用 05 Q&A 04 Curve对raft的优化项目背景 Curve是一个高性能、更稳定、易运维的云原生分布式存储系统，支持块存储和文件存储 2018~2021 Curve块存储 2021~2022 Curve文件存储 • 基于Openstack构建云计算平台操作系统芯片数据库云原生 AI训练大数据社区生态Curve介绍 01 02 raft和braft 03 raft在Curve中的应用 05 Q&A 04 Curve对raft的优化RAFT协议简介什么是raft • raft 是一种新型易于理解的分布式一致性复制协议，由斯坦福大学的Diego Ongaro和John Ousterhout提出，《In Search of Error& e); braft 接口什么是braftCurve介绍 01 02 raft和braft 03 raft在Curve中的应用 05 Q&A 04 Curve对raft的优化Curve块存储RAFT应用 Curve块存储 • 高性能、更稳定、易运维 • 支持NBD(network block device)、iscsi • 支持RDMA和SPDK Curve块存储架构

0 码力 | 29 页 | 2.20 MB | 6 月前
3
Curve核心组件之Client - 网易数帆

https://github.com/opencurve/curveCURVE基本架构 01 02 03 04 Client总体介绍热升级NEBD总体介绍新版本Client/NEBD性能优化CURVE基本架构 • 元数据节点 MDS • 管理和存储元数据信息 • 感知集群状态，合理调度 • 数据节点 Chunkserver • 数据存储 • 副本一致性，raft • 客户端 • 对元数据增删改查 • 对数据增删改查 • 快照克隆服务器CURVE基本架构 01 02 03 04 Client总体介绍热升级NEBD总体介绍新版本Client/NEBD性能优化 QEMU、Curve-NBD：上层应用  通过链接curve-client使用curve提供的服务  FileManager：提供接口，记录已挂载卷  FileInstance：对应一个已挂载的卷未能返回。所以，在这种情况下，重试请求会将RPC超时时间进行增加。CURVE基本架构 01 02 03 04 Client总体介绍热升级NEBD总体介绍新版本Client/NEBD性能优化NEBD 整体介绍热升级之前，QEMU是直接链接curve-client，所以client版本需要升级时，需要对QEMU进程进行重启。NEBD 整体介绍在QEMU和Curve Client中间加入热升级模块，避

0 码力 | 27 页 | 1.57 MB | 6 月前
3
NJSD eBPF 技术文档 - 0924版本

ll底层ext4 • 内核调⽤延迟测试 • 与FUSE Daemon通讯120us左右，FUSE Daemon⼤概10us以内 • 瓶颈在/dev/fuse通讯开销基于FUSE可能的优化点 • 降低内核与libfuse通讯延迟 • 基于⽂件属性的操作内核直接返回？ • 基于⽂件数据的操作先内核读写 cache？实现POSIX兼容API途径及问题 • 基于FUSE的实现 passthrough_ll 调⽤底层ext4 • 进程共享内存通信延迟10us+ • others 开销 10us+ • fuse_ll_ops开销10us-基于FUSE的优化框架 • 框架优化的要点 • 共享inode cache • 共享data cache的映射 • GETATTR流程 • ⽂件读取流程 • 相关⼯作 • extFUSE • google 与底层⽂件关系 (filename, offset, len) = func (inodeid, offset, len) • 读cache流程 • 写cache流程基于inode cache优化 • bpf程序类型 BPF_PROG_TYPE_EXTFUSE • Hook点及⽅法 • fuse_request_send • FUSE_LOOKUP / FUSE_GETATTR

0 码力 | 20 页 | 7.40 MB | 6 月前
3
curvefs client删除文件和目录功能设计

inode id 由于inode放在原地，那么由于dentry已经被删除，那么查询工具就较为复杂，不能复用原有的client逻辑，需要组织成moosefs那样的meta文件系统可能需要引入额外的复杂性，但是依然可以实现简单的工具查询。由于该方案，删除的inode是分散于每个partition中，那么查询工具可能需要遍历所有partion去查询所有的删除inode。第二种方案：将ino sh目录可以是实际的目录结构，有dentry和inode，并遵循当前inode和dentry的放置方式（inode按照inodeid分布，dentry按照parentid分布）这种方案的优点是便于工具对trash进行查询，毕竟是实际的目录结构，完全遵循文件系统，可能可以复用client的当前设计，甚至可以参考moosefs实现一个meta文件系统来管理，更为优雅。但是缺点是DEL和UNDEL需，二是每个fs一个trash，并且trash不能放在fs的根目录下，因为存在跟用户的目录重名的问题。一是使用全局唯一的trash 倾向于使用方案1，各方面实现上较为简单，异常处理不会很复杂，查询工具可以先实现一个简单的。 3. 是否需要做session机制（在metaserver打开），来维护inode的打开情况？经讨论，需要实现session机制，以应对打开文件被另一个进程删除的场景的场景。

0 码力 | 15 页 | 325.42 KB | 6 月前
3
Curve质量监控与运维 - 网易数帆

github代码仓库： https://github.com/opencurve/curve Curve 3/33为用户服务作为一个复杂的大型分布式存储系统，Curve 需要利用科学的方法论和专业的工具，在整个软件生命周期内更好地为用户服务：  质量——向用户交付稳定可靠的软件；  监控——直观地展示Curve运行状态；  运维——保障Curve始终稳定高效运行。质量 ✓ 质质量管理体系（设计、开发、review、CI） ✓ 测试方法论（单元测试、集成测试、系统测试）监控 ✓ 监控架构 ✓ 指标采集、后端处理、可视化展示运维 ✓ 运维特性（易部署、易升级、自治） ✓ 运维工具（部署工具、管理工具） 4/33背景 01 02 03 04 Curve质量控制 Curve监控体系 Curve运维体系软件质量软件质量的定义是：软件与明确地和隐含地定义的需求相一致的程度。理与展示：  Prometheus——面向云原生应用程序的开源的监控&报警工具，curve利用它进行监控指标的采集与存储。  Daily reporter——python脚本，定时从 Grafana获取指定集群的图表，生成集群监控日报，并通过邮件发送。  Grafana——开源的度量分析和可视化工具， curve利用它进行数据可视化展示。 20/33监控指标（metric）的生成

0 码力 | 33 页 | 2.64 MB | 6 月前
3

共 21 条前往

页

分类

语言

格式

TGT服务器的优化

Curve设计要点

PFS SPDK: Storage Performance Development Kit

CurveFS Copyset与FS对应关系

Curve核心组件之chunkserver

Raft在Curve存储中的工程实践

Curve核心组件之Client - 网易数帆

NJSD eBPF 技术文档 - 0924版本

curvefs client删除文件和目录功能设计

Curve质量监控与运维 - 网易数帆