软件测试工具 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Curve质量监控与运维 - 网易数帆

作为一个复杂的大型分布式存储系统，Curve 需要利用科学的方法论和专业的工具，在整个软件生命周期内更好地为用户服务：  质量——向用户交付稳定可靠的软件；  监控——直观地展示Curve运行状态；  运维——保障Curve始终稳定高效运行。质量 ✓ 质量管理体系（设计、开发、review、CI） ✓ 测试方法论（单元测试、集成测试、系统测试）监控 ✓ 监控架构 ✓ 指标采集、后端处理、可视化展示运维 ✓ 运维特性（易部署、易升级、自治） ✓ 运维工具（部署工具、管理工具） 4/33背景 01 02 03 04 Curve质量控制 Curve监控体系 Curve运维体系软件质量软件质量的定义是：软件与明确地和隐含地定义的需求相一致的程度。为了确保最终交付的软件满足需求，必须将质量控制贯穿于设计、开发到测试的整个流程中。设计  设计流程  文档规范开发开发  编码规范与提交流程  版本管理测试  测试方法论  CI与异常测试 6/33设计流程 Curve团队采用敏捷开发模式，负责人在制定迭代计划时，确认哪些任务需要设计文档：  小需求（改动小）将实现思路记录到任务管理系统中（JIRA），即可进行开发；  大需求（新模块、复杂功能）需要输出独立设计文档，并进行评审；对于功能或性能影响较大的功能，还需要进行POC验证；评审和验证通过后才能启动开发

0 码力 | 33 页 | 2.64 MB | 6 月前
3
Curve设计要点

github代码仓库： https://github.com/opencurve/curve 概述背景 01 02 03 04 总体设计系统特性近期规划背景 • 多个存储软件：SDFS、NEFS、NBS • 已有的开源软件：Ceph • 不能胜任性能、延迟敏感的场景 • 异常场景抖动较大（比如慢盘场景） • 去中心节点设计在集群不均衡的情况下需要人工运维 • 基于通用分布式存储构建上层存储服务背景 • 数据chunk + 校验chunk • 支撑EC存储场景多个单副本的 chunk 形成 EC 组一个对象作为 EC 组的一个满条带挖洞即时空间回收拓扑 • 管理和组织机器 • 软件单元：chunkserver • 物理机：server • 故障域：zone • 物理池：poolIO流程 client MDS leader Chunk server 1、发起请求 Ceph（L/N） Curve 151.89% 204.56% 单卷4K随机读写平均延迟(ms) 1.244 3.2 3.1 0.998 4K随机写 4K随机读 61.12 % 67.8% 测试环境：6台服务器*20块SATA SSD，E5-2660 v4，256G，3副本场景高性能高性能 • quorum机制：raft • 轻量级快照 • io路径上的优化 • filepool落盘零放大

0 码力 | 35 页 | 2.03 MB | 6 月前
3
TGT服务器的优化

• 可靠性、稳定性方面有自己的的特色，使用raft副本一致性和copyset概念可以自动修复损坏的副本，并且可扩容。无论在可靠性、稳定性还是性价比方面都很有优势，使用廉价硬件搭建。iSCSI软件 • Client端: iscsi initiator，系统自带 • Linux open-iscsi • Windows iSCSI 发起者 • 服务器端 • 必须是CurveBS原生支持比较久的历史，原来叫STGT，后来改成TGT • 纯用户态，不与内核绑定 • 支持复杂的存储系统，例如ceph rbd, sheepdog, glfs • 纯C代码，外加一些脚本 • 完整的源代码和维护工具、手册 • 编写IO驱动比较容易，容易扩展支持新的存储系统 • 代码独立，容易编译、调试、修改，适应性强让TGT支持curve • 编写curve驱动，底层异步提交I/O，pipeline • 利用NEBD connection，在单线程里做event loop多路复用。 • 多个target时，如果挂的设备多，一旦客户端请求量大，就会忙不过来。 • 开源界有尝试修改 • 例如sheepdog的开发者提交过一个patch，但是测试效果不理想，分析原因，event loop依然是瓶颈对TGT的性能优化 • IO是使用多个epoll 线程，充分发挥多CPU能力 • 当前策略是每个target一个epoll线程，负责Initiator发过来的I/O

0 码力 | 15 页 | 637.11 KB | 6 月前
3
PFS SPDK: Storage Performance Development Kit

●根据阿里《When Cloud Storage Meets RDMA》的说法 ●在100Gbps网络带宽时，内存带宽成为瓶颈 ●Intel Memory Latency Checker (MLC)测试得到的CPU内存带宽是 61Gbps10/17/22 3 RDMA可以减轻CPU负担 ●可以减少CPU操作网络通讯的开销 ●读写内存都由网卡进行offload ●应用程序不再通过系统调用在内核和用户态来回切换10/17/22 所以不需要元数据高性能，这方面PFS也合适10/17/22 6 对PFS的修改 ●基于阿里开源的PFS ●不再基于daemon模式，而是直接使用pfs core api ●依然向外提供管理工具, 例如 pfs ls、cp、rm等 ●增加spdk驱动10/17/22 7 新增PFS接口 ●增加pfs_pwritev和pfs_preadv接口 ●ssize_t pfs_preadv(int ●网络部分依赖内核tcp，不是零copy10/17/22 18 进展 ●还在测试CurveBS ●布置、监控等工具需要更新10/17/22 19 性能测试 ●使用pfs daemon测试 ●估计非daemon模式的会更快一点，因为没有跨进程开销10/17/22 20 Write,DMA write,Write-zero测试10/17/22 21 fio 4k 1个并发+单深度10/17/22

0 码力 | 23 页 | 4.21 MB | 6 月前
3
BRPC与UCX集成指南

●能透明支持多个链路传输，例如多网卡bond ●编译成.so或lib的方式，可以集成到应用程序里 ●有完善的配置功能，ucx_info可以dump配置信息 ●有性能测试工具 ●比较详细的文档2223 UCS ●是一些工具代码，例如 –链表 –hash table –epoll event loop – memory register cache –config file24 UCT or-brpc.git –curve主干分支 –ucx_am当前rdma分支 ●对brcp的改动不大，加入的模块基本上独立 ●降低了开发难度 ●ucx满足我们对rdma支持的需求 ●已经测试通过了curve验证，取得了不错的性能提升66 Thank You！

0 码力 | 66 页 | 16.29 MB | 6 月前
3
NJSD eBPF 技术文档 - 0924版本

Curve的应⽤场景及挑战 • Curve客户端⾯临问题及分析 • 什么是ebpf • 基于epbf的Curve Cache设计 • Curve社区介绍Curve是什么？ • Curve云原⽣软件定义存储 • Curve分布式块存储 • Curve分布式⽂件存储 • ⾼性能、易运维、云原⽣Curve⽂件系统框架和主要应⽤场景 • AI机器学习场景 • ⼤数据计算场景 • 设置属性 • 关闭⽂件时会发送FLUSH请求和RELEASE请求FUSE⽂件IO读写流程FUSE的IO路径及瓶颈分析 • 对⽐测试 • ⽂件访问测试直接访问ext4 • 通过FUSE访问passthrough_ll底层ext4 • 内核调⽤延迟测试 • 与FUSE Daemon通讯120us左右，FUSE Daemon⼤概10us以内 • 瓶颈在/dev/fuse通讯开销基于FUSE可能的优化点

0 码力 | 20 页 | 7.40 MB | 6 月前
3
Curve 分布式存储设计

无法满足高的性能需求Curve的设计目标 1. Curve云原生软件定义存储 2. Curve块存储 3. Curve文件存储 4. 高性能，易运维，云原生Curve块存储 1. 高性能分布式共享数据库场景 2. Curve块存储提供底层分布式共享存储 3. Polardb for PostgreSQL提供上层高性能数据库服务 4. 性能测试 1. benchmarkSQL 每分钟事务数提升39%

0 码力 | 20 页 | 4.13 MB | 6 月前
3
CurveFS Client 概要设计

只写打开 O_RDWR 读写打开以上3个必须指定且只能指定一个 O_APPEND 只追加写 O_CREAT 文件不存在时创建 O_EXCL 如果同时指定了O_CREAT，而文件已存在，则会出错，用此测试文件是否存在，如果不存在则创建此文件。 O_TRUNC 如果文件存在，且为只写或只读打开，则将其文件长度截短为0 O_DSYNC sync数据和必要元数据（不影响读取刚写入的数据） O_SYNC 向上对接fuse接口，协调上述模块交互，实现功能。 main 主函数模块，类似deamon，接收mount消息并处理（fuse session）。除上述功能以外，还需实现文件系统创建和fuse挂载工具，功能主要是：创建文件系统，指定文件系统的名字、卷大小（多文件系统）、扩展文件系统？挂载fuse文件系统，指定挂载点、文件系统名字或fsID、server ip（可从配置文件读取）。模块划分

0 码力 | 11 页 | 487.92 KB | 6 月前
3
CurveFS Copyset与FS对应关系

结论：心跳参考curve。目前这些调度器在curvefs第一阶段不用全部实现。所有和均衡相关的，暂时不做。只做和故障处理相关的副本补全恢复的调度。 6、详细设计 6.1 创建fs curvefs管理工具发起创建fs命令，mds收到createfs命令之后，在mds插入的一条fs记录，状态为NEW。然后为fs创建copyset，默认为3个。mds调用topology的接口找到3个可用的copyset，如果没有足够可用的cop 一台机器上建议的copyset数量当前curve机器上的copyset的数量是100个。curvefs也可按照curve的规格，每个机器上管理100个copyset。实际上这个值通过配置文件控制，到时候可以根据测试结果确定合适的copyset的数量。 8.3 每个copyset建议管理存储容量的大小如果有100个的copyset，每个copyset管理2GB大小的元数据。

0 码力 | 19 页 | 383.29 KB | 6 月前
3
curvefs client删除文件和目录功能设计

inode id 由于inode放在原地，那么由于dentry已经被删除，那么查询工具就较为复杂，不能复用原有的client逻辑，需要组织成moosefs那样的meta文件系统可能需要引入额外的复杂性，但是依然可以实现简单的工具查询。由于该方案，删除的inode是分散于每个partition中，那么查询工具可能需要遍历所有partion去查询所有的删除inode。第二种方案：将ino sh目录可以是实际的目录结构，有dentry和inode，并遵循当前inode和dentry的放置方式（inode按照inodeid分布，dentry按照parentid分布）这种方案的优点是便于工具对trash进行查询，毕竟是实际的目录结构，完全遵循文件系统，可能可以复用client的当前设计，甚至可以参考moosefs实现一个meta文件系统来管理，更为优雅。但是缺点是DEL和UNDEL需，二是每个fs一个trash，并且trash不能放在fs的根目录下，因为存在跟用户的目录重名的问题。一是使用全局唯一的trash 倾向于使用方案1，各方面实现上较为简单，异常处理不会很复杂，查询工具可以先实现一个简单的。 3. 是否需要做session机制（在metaserver打开），来维护inode的打开情况？经讨论，需要实现session机制，以应对打开文件被另一个进程删除的场景的场景。

0 码力 | 15 页 | 325.42 KB | 6 月前
3

共 23 条前往

页

分类

语言

格式

Curve质量监控与运维 - 网易数帆

Curve设计要点

TGT服务器的优化

PFS SPDK: Storage Performance Development Kit

BRPC与UCX集成指南

NJSD eBPF 技术文档 - 0924版本

Curve 分布式存储设计

CurveFS Client 概要设计

CurveFS Copyset与FS对应关系

curvefs client删除文件和目录功能设计