HBase最佳实践及优化高速计数器aggregation类型的任务 – HBase强一致性(Strongly consistent)读写保证 • 其他适用Hadoop的NoSQL场景 – HBase基于HDFS存储,和 MapReduce/Hive/Spark等紧密结合 11 Postgres Conference China 2016 中国用户大会 HBase现存缺点 • SQL(传统BI)不友好,不支持很多传统DBMS 功能,如外键,约束… 他组件构成 清帐单 原始数据 3台FTP 服务器 Hadoop集群 Hadoop分布式计 算引擎 MapReduce Hadoop分布式数 据库HBase Hadoop分布式 SQL查询框架 Hive 清单 BOSS 导入 账单 CXBILL 导入 HBase Thrift 服务 器 清单查询接口 帐单查询接口 用户账单批量 生成 清单统计业务 冲销支持 生产数据提取 采用全国集中的一级架构方案进行建 设 • 主要包含数据采集子系统、数据入库 子系统、数据存储子系统、数据查询 与分析子系统 • 采用Hadoop/HBase作为上网记录存储 方案 • 采用MapReduce/Hive作用统计分析和 数据挖掘工具 【关键性能指标】 – 每日入库>5TB数据 – 上网记录入库时间:一般小于30分钟, 实际约10分钟 – 存储全国移动用户不小于6个月的原始 上网记录,统计分析中间报表数据保存0 码力 | 45 页 | 4.33 MB | 1 年前3
共 1 条
- 1













