HBase最佳实践及优化固定一个数据模型(固定数据模型能得到高性能,同时满足应用 需求) – 无数据类型 Postgres Conference China 2016 中国用户大会 HBase的实现特性 • 非常高的数据读写速度,为写特别优化 – 高效的随机读取 – 对于数据的某一个子集能够进行有效地扫描 • 具有容错特性,能够将数据持久化的非易失性 存储中 – 使用HDFS做底层存储,可利用Hadoop的压缩 HBase适用场景 • 高并发高性能读写访问场景 – 数据有随机更新、删除 – 数据写入性能高于读取性能,适合写多读少或数据 加载有实时性要求的场景 • 需按主键排序的半结构化数据存储 • 支持基于固定有限条件的高并发高性能查询 • 高速计数器aggregation类型的任务 – HBase强一致性(Strongly consistent)读写保证 • 其他适用Hadoop的NoSQL场景 • 扫描大数据量时吞吐率高(列式存 储和多副本机制) – 目标: 相对Parquet的扫描性能差距 在2x之内 • 访问少量数据时延时低(主键索引 和多数占优复制机制) – 目标: SSD上读写延时不超过1毫秒 • 类似的数据库语义(初期支持单行 记录的ACID) • 关系数据模型 – SQL查询 – “NoSQL”风格的扫描/插入/更新 (Java客户端) 13 28日下午 15:400 码力 | 45 页 | 4.33 MB | 1 年前3
HBase基本介绍after Google's Bigtable … 先来⼀一段HBase官⽹网的⾃自我介绍. blabla翻译⼀一下 重点看其中的红字, 什什么hadoop数据库, 分布式的, 可伸缩的, 随机实时读写 ⼗十亿级⾏行行, 百万级列列 每次看⼀一个项⽬目介绍完⾃自⼰己, 还是不不知道他是⼲干嘛的, 希望今天我介绍完, ⼤大家能知道他是⼲干嘛的 A Bigtable is a sparse(稀疏)0 码力 | 33 页 | 4.86 MB | 1 年前3
共 2 条
- 1













