字符类 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

HBase基本介绍

整个table都是按rowkey排序存储的 • 按rowkey⽤用LSM树做了了索引, 没有其他⼆二级索引 • 所以只有按rowkey查询⽐比较快, 其他全表扫 • 除了了列列族要求是可打印字符, 别的都可以是任意⼆二进制数据数据模型 RowKey • ColumnFamily的设计是要求把相关的列列放在同族 • 所有的各项配置, 都是指定到列列族上, 不不是列列, 同列列族数据⽇日志时间作为version时间 • 其余作为10列列 1个ID, 100条⾏行行为(100个版本), 10列列 = 1000个KV对: id存了了1000次, 时间存了了1000次, 所有列列名(location这个字符串串)存了了100次 1个ID, 100条⾏行行为(100个版本), 1列列 = 100个KV对寻迹数据场景千亿级PV, 万亿个KV对寻迹数据对⽐比这⾥里里先对⽐比前两⾏行行

0 码力 | 33 页 | 4.86 MB | 1 年前
3
HBase最佳实践及优化

6个月总量高达 ~600TB – 从600TB清单数据中检索某用户某个月的清单记录，响应时间应小于1秒 – 支持高峰期每秒2000个并发访问查询 – 满足现在清帐单业务的查询统计需求(23类) – 实时入库，清单文件无积压（清单文件最大2万条，最小1条记录。实时生产，平均每秒2个20MB的清单文件，高峰期到每秒10个 20MB文件） – 对联机分析必须提供标准编程接口，支持SQL/JDBC/ODBC等 Compaction的次数 • 现在缺省128MB，一般不用修改 Postgres Conference China 2016 中国用户大会 HBase的GC特点 • 由单个RPC带来的操作类垃圾对象是短期的 • Memstore是相对长期驻留的，按2MB为单位分配 • Blockcache是长期驻留的，按64KB为单位分配 • 如何有效的回收RPC操作带来的临时对象是HBase 的GC重点

0 码力 | 45 页 | 4.33 MB | 1 年前
3

共 2 条前往

页

HBase 基本介绍最佳实践优化

分类

语言

格式

HBase基本介绍

HBase最佳实践及优化