制造业组织 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Curve设计要点

对象存储，不限制数量异步快照、增量快照从快照/镜像克隆 ( lazy/非lazy ) 从快照回滚数据组织形式 • 底层可用性 / 可靠性扩展性 / 负载均衡向上提供无差别文件流 • Application 块/对象/EC等感知具体格式提供不同文件类型支撑不同上层应用数据组织形式 • PageFile/AppendFile/AppendECFile • Segment 多个连续地址空间chunk（物理文件）的聚合数据组织形式 • CopySet • 逻辑概念 • 减少元数据数量 • 数据放置的基本单元 • 提高数据可靠性 • 包含多个chunk • 减少复制组数量类似Ceph中的PG 「Copysets: Reducing the Frequency of Data Loss in Cloud Storage」数据组织形式 • PageFile • 地址空间到—>chunk: 提供4kb随机读写能力数据组织形式 • PageFile • 地址空间到—>chunk: 1 : N chunk有先后关系 • 创建时指定大小，lazy分配chunk • 提供4kb随机读写能力 • 支撑块设备应用场景块设备层面的快照功能即为文件层面快照数据组织形式 • AppendFile • 地址空间到—>chunk: 1 : 1 • 采用append的方式写入数据组织形式 • AppendFile

0 码力 | 35 页 | 2.03 MB | 6 月前
3
Curve文件系统元数据管理

3. 4. Inode 1、设计一个分布式文件系统需要考虑的点： 2、其他文件系统的调研总结 3、各内存结构体 4、curve文件系统的元数据内存组织 4.1 inode定义： 4.2 dentry的定义： 4.3 内存组织 5 元数据分片 5.1 分片方式一：inode和dentry都按照parentid分片 5.1.1 场景分析查找：查找/A/C。创建：/A/C不在，创建/A/C 3、各内存结构体时间复杂度空间复杂度特点可用实现 Btree 一个节点上保存多条数据，减少树的层次(4~5层)，方便从盘上读取数据，减少去盘上读取次数。适合在盘上和内存组织目录树。 google，https://github.com/abseil/abseil-cpp/tree/master/absl/c ontainer 实现了btree map和btree set，(Apache)。有关，最理想可以达到O(1)复杂度，最差O(n)复杂度。 c++ stl unordered_map moose，使用c实现 4、curve文件系统的元数据内存组织 curve文件系统元数据主要有3个类型，inode， dentry，。 extent 4.1 inode定义： inode定义见：curve文件系统元数据proto（代码接口定义，已实现）©

0 码力 | 24 页 | 204.67 KB | 6 月前
3
Curve核心组件之snapshotclone

clone Task user 快照元数据 2.创建内部快照 5.删除内部快照快照数据 1.发起快照 SnapshotCloneServer 6.删除内部快照数据快照的元数据和数据组织字段类型说明 uuid string 快照唯一Id user string 所属用户 fileName string 快照目标卷名 snapshotName string 快照名 seqNum segment的size fileLength uint64_t 卷的大小 time uint64_t 快照创建时间 status enum 快照的创建状态 Etcd中的快照元数据:快照的元数据和数据组织 • fileInfo 快照目的卷的卷名等信息 • chunkMap 快照chunk映射表 MetaObject： • 保存完整的chunk数据，大小为一个 Chunk的大小，即16MB • 打快照时读取当前目标卷的所有快照的全部metaObject • 根据本快照的chunk映射表，判断当前的快照chunk是否需要转储增量转储原理：快照在CHUNKSERVER上的数据组织  快照chunk和普通chunk，都是 ChunkServer上的ext4文件系统中的文件，称为SnapFile和ChunkFile；  SnapFile 与ChunkFile是同构的

0 码力 | 23 页 | 1.32 MB | 6 月前
3
CurveFS Client 概要设计

Page 10 of 11 接口设计相关接口设计，见curve文件系统元数据proto（代码接口定义，已实现） Cache设计 Client的重要部分，就是上述这些cache的组织，基于以下几点考虑cache的组织方式： 1.由于cache不命中情况下，损失了cache查找这部分时间，因此，应当选用cache查找尽可能快的结构，这里考虑采用hash_map。 2. 由于fuse一次moun

0 码力 | 11 页 | 487.92 KB | 6 月前
3
curvefs client删除文件和目录功能设计

那么需要实现类似freelist一样的东西来保存当前已经"被删"的inode id 由于inode放在原地，那么由于dentry已经被删除，那么查询工具就较为复杂，不能复用原有的client逻辑，需要组织成moosefs那样的meta文件系统可能需要引入额外的复杂性，但是依然可以实现简单的工具查询。由于该方案，删除的inode是分散于每个partition中，那么查询工具可能需要遍历所有partion去查询所有的删除inode。，如果长时间收不到client refresh session，即session超时，此时清理该client的所有文件打开的session记录。工具实现：工具需要实现查询各个parition，组织展示trash中数据; 工具实现强制清理trash的接口； S3实际删除部分： S3中对象的删除需要在metaserver中调用，而不是client调用，实现上删除接口应该不需要处理inode，

0 码力 | 15 页 | 325.42 KB | 6 月前
3
Curve 分布式存储设计

Curve块存储将虚拟块设备映射到文件 2. 每个文件包含的chunk分散在集群的存储节点 3. chunkserver按照故障域分组 4. copyset中的节点属于不同的故障域数据组织Curve块存储 IO流程Curve块存储 1. chunkserver负责数据的存储 2. RAFT协议保持数据的一致性 3. chunkfile pool降低元数据开销 Chunkserver服务Curve块存储

0 码力 | 20 页 | 4.13 MB | 6 月前
3
Curve核心组件之mds – 网易数帆

心跳模块。跟chunkserver进行交互，收集chunkserver上的负载信息、 copyset信息等。 • Scheduler: 调度模块。用于自动容错和负载均衡。TOPOLOGY topology用于管理和组织机器，利用底层机器的放置、网络的规划以面向业务提供如下功能和非功能需求。 1. 故障域的隔离：比如副本的放置分布在不同机器，不同机架，或是不同的交换机下面。 2. 隔离和共享：不同用户的数据可以实现固定物理资源的隔离和共享。

0 码力 | 23 页 | 1.74 MB | 6 月前
3
CurveFS方案设计

关键点 mds volume 文件空间管理文件系统的元数据所在的copyset分配策略（前期可以考虑都分配到同一个copyset上） metaserver inode/dentry的内存组织形式数据持久化 client curvefs 的 client 开发快照逻辑各接口实现元数据交互流程元数据设计元数据设计分以下几个部分 inode 和 dentry 的数据结构（

0 码力 | 14 页 | 619.32 KB | 6 月前
3
CurveFS Copyset与FS对应关系

inodeid查询，dentry是拿着parent的inode id去查询。© XXX Page 6 of 19 一个fs的meta partition使用第一个叫做MetaWrapper的结构体组织起来© XXX Page 7 of 19 type MetaWrapper struct { sync.RWMutex cluster string localIP

0 码力 | 19 页 | 383.29 KB | 6 月前
3

共 9 条前往

页

分类

语言

格式

Curve设计要点

Curve文件系统元数据管理

Curve核心组件之snapshotclone

CurveFS Client 概要设计

curvefs client删除文件和目录功能设计

Curve 分布式存储设计

Curve核心组件之mds – 网易数帆

CurveFS方案设计

CurveFS Copyset与FS对应关系