蔡岳毅-基于ClickHouse+StarRocks构建支撑千亿级数据量的高可用查询引擎into,但最理想的是消费Kafka; 全球敏捷运维峰会 广州站 ClickHouse/StarRocks在酒店数据智能平台的架构 全球敏捷运维峰会 广州站 ClickHouse的全量数据同步流程 1. 清空A_temp表,将最新的数据从Hive通过ETL导入 到A_temp表; 2. 将A rename 成A_temp_temp; 3. 将A_temp 1. 采用 waterdrop 的方式大幅提升写入速度; 2. 直接读Hdfs文件的方式,但内存波动较大; 全球敏捷运维峰会 广州站 ClickHouse的增量数据同步流程 传统方式: 1. 将最近3个月的数据从Hive通过ETL入到A_temp表; 2. 将A表中3个月之前的数据select into到A_temp表; 30 码力 | 15 页 | 1.33 MB | 1 年前3
4. ClickHouse在苏宁用户画像场景的实践苏宁如何使用ClickHouse ClickHouse集成Bitmap 用户画像场景实践 17 用户画像原有的流程及痛点 Hive表 商品数据 ElasticSearch 用户数据 交易数据 HBase Redis 第三方… Spark 用户画像平台 现有的流程: ES中定义标签的大宽表 通过Spark关联各种业务数据,插入到ES大 宽表。 0 码力 | 32 页 | 1.47 MB | 1 年前3
6. ClickHouse在众安的实践--> ~600MBps, ~4x • 升级后 • ~250s --> ~69s,~3.62x l 数据加热后 ~69s -- > 18s ,~3.8x • ToDos • 优化数据导入流程 • 支持多分区,支持指定主键 • 常用字段加热 29 常用分析性能的命令分享 • linux命令 • top:查看系统cpu使用率,内存使用率等 • iotop:查看系统进程占用io情况0 码力 | 28 页 | 4.00 MB | 1 年前3
共 3 条
- 1













