字符匹配 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

HBase基本介绍

整个table都是按rowkey排序存储的 • 按rowkey⽤用LSM树做了了索引, 没有其他⼆二级索引 • 所以只有按rowkey查询⽐比较快, 其他全表扫 • 除了了列列族要求是可打印字符, 别的都可以是任意⼆二进制数据数据模型 RowKey • ColumnFamily的设计是要求把相关的列列放在同族 • 所有的各项配置, 都是指定到列列族上, 不不是列列, 同列列族数据⽇日志时间作为version时间 • 其余作为10列列 1个ID, 100条⾏行行为(100个版本), 10列列 = 1000个KV对: id存了了1000次, 时间存了了1000次, 所有列列名(location这个字符串串)存了了100次 1个ID, 100条⾏行行为(100个版本), 1列列 = 100个KV对寻迹数据场景千亿级PV, 万亿个KV对寻迹数据对⽐比这⾥里里先对⽐比前两⾏行行

0 码力 | 33 页 | 4.86 MB | 1 年前
3
HBase最佳实践及优化

RegionServer硬件建议 • 服务器硬盘空间不大于6TB*RegionServer • 足够的内存堆大小（约等于硬盘空间/200） • HBase对于CPU要求高，越多core越好 • 磁盘与网络的速度匹配 – 比如如果是24块硬盘，吞吐率约2.4GB/s，则网络需要至少万兆网络。而千兆网一般配4到6 块硬盘。 • 更多的硬盘数量能增加并发，提高HBase 的读性能 Postgres Conference

0 码力 | 45 页 | 4.33 MB | 1 年前
3

共 2 条前往

页

HBase 基本介绍最佳实践优化