HBase最佳实践及优化Family限制(数目,Partition对齐) • Region资源消耗大,实例数目不能太多 • 无法保证服务质量* – Split/Compaction等操作对集群性能影响极大 • 多租户隔离能力差 • 大内存(>100GB)管理差 12 Postgres Conference China 2016 中国用户大会 Kudu的设计目标 • 扫描大数据量时吞吐率高(列式存 储和多副本机制) – 目标: 集群管理节点 IBM 3650 PC,双路六核,Intel X5650处理器, 2.66GHz主频,48GB内存,6*1TB SATA硬盘 1台 Hadoop集群 NameNode/JobTracker IBM 3650 PC,双路六核,Intel X5650处理器, 2.66GHz主频,48GB内存,6*1TB SATA硬盘 1台 NameNode/JobTracker HA备份 节点 IBM 3650 66GHz主频,48GB内存,6*1TB SATA硬盘 1台 Secondary NameNode IBM 3650 PC,双路六核,Intel X5650处理器, 2.66GHz主频,48GB内存,6*1TB SATA硬盘 1台 HBase 集群Master和Zookeeper 节点 IBM 3650 PC,双路六核,Intel X5650处理器, 2.66GHz主频,48GB内存,6*1TB SATA硬盘0 码力 | 45 页 | 4.33 MB | 1 年前3
HBase基本介绍/ bloom block 这个图是整个HFile⽂文件的结构. 最下是⽂文件尾, 根据⽂文件尾上的信息, 就能读取到 load-on-open部分的各种索引信息 最上是数据块所有实际的数据, 数据块的叶节点索引, 布隆隆索引都在这 系统组成 HFile DataBlock • 排序好的KeyValue 这⾥里里重点看⼀一下Datablock内部结构 系统组成 DataBlockEncoding0 码力 | 33 页 | 4.86 MB | 1 年前3
共 2 条
- 1













