 HBase基本介绍Column • 根据查询需求决定schema • 单⼀一⼤大宽表, 避免跨表查询 • 必要的时候进⾏行行冗余, 反范式 • 相关的数据要存放在⼀一起 • 不不要有热点 • 将列列限定符视为数据通常是⼀一个合理理选择 Schema设计 在关于数据库⾥里里我们有各种范式来帮助设计, 在hbase⾥里里也要合理理设计⼀一下 https://link.springer.com/article/100 码力 | 33 页 | 4.86 MB | 1 年前3 HBase基本介绍Column • 根据查询需求决定schema • 单⼀一⼤大宽表, 避免跨表查询 • 必要的时候进⾏行行冗余, 反范式 • 相关的数据要存放在⼀一起 • 不不要有热点 • 将列列限定符视为数据通常是⼀一个合理理选择 Schema设计 在关于数据库⾥里里我们有各种范式来帮助设计, 在hbase⾥里里也要合理理设计⼀一下 https://link.springer.com/article/100 码力 | 33 页 | 4.86 MB | 1 年前3
 HBase最佳实践及优化• 使用批量数据处理接口 • 保持2MB的Chunk Size • 使用内存pool缓存HTable及其他可重用对象 • 使用多线程并发技术 – Parallel Scanner • 使用异步调用接口 – AsyncClient • 使用数据预取以及预缓存 Postgres Conference China 2016 中国用户大会 Thanks! @Cloudera中国 @陈飚0 码力 | 45 页 | 4.33 MB | 1 年前3 HBase最佳实践及优化• 使用批量数据处理接口 • 保持2MB的Chunk Size • 使用内存pool缓存HTable及其他可重用对象 • 使用多线程并发技术 – Parallel Scanner • 使用异步调用接口 – AsyncClient • 使用数据预取以及预缓存 Postgres Conference China 2016 中国用户大会 Thanks! @Cloudera中国 @陈飚0 码力 | 45 页 | 4.33 MB | 1 年前3
共 2 条
- 1













