流程自动化 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

蔡岳毅-基于ClickHouse+StarRocks构建支撑千亿级数据量的高可用查询引擎

into，但最理想的是消费Kafka；全球敏捷运维峰会广州站 ClickHouse/StarRocks在酒店数据智能平台的架构全球敏捷运维峰会广州站 ClickHouse的全量数据同步流程 1. 清空A_temp表，将最新的数据从Hive通过ETL导入到A_temp表; 2. 将A rename 成A_temp_temp; 3. 将A_temp 1. 采用 waterdrop 的方式大幅提升写入速度； 2. 直接读Hdfs文件的方式，但内存波动较大；全球敏捷运维峰会广州站 ClickHouse的增量数据同步流程传统方式： 1. 将最近3个月的数据从Hive通过ETL入到A_temp表; 2. 将A表中3个月之前的数据select into到A_temp表； 3

0 码力 | 15 页 | 1.33 MB | 1 年前
3
4. ClickHouse在苏宁用户画像场景的实践

苏宁如何使用ClickHouse ClickHouse集成Bitmap 用户画像场景实践 17 用户画像原有的流程及痛点 Hive表商品数据 ElasticSearch 用户数据交易数据 HBase Redis 第三方… Spark 用户画像平台现有的流程：  ES中定义标签的大宽表  通过Spark关联各种业务数据，插入到ES大宽表。 

0 码力 | 32 页 | 1.47 MB | 1 年前
3
6. ClickHouse在众安的实践

--> ~600MBps, ~4x • 升级后 • ~250s --> ~69s，~3.62x l 数据加热后～69s -- > 18s ，～3.8x • ToDos • 优化数据导入流程 • 支持多分区，支持指定主键 • 常用字段加热 29 常用分析性能的命令分享 • linux命令 • top：查看系统cpu使用率，内存使用率等 • iotop：查看系统进程占用io情况

0 码力 | 28 页 | 4.00 MB | 1 年前
3

共 3 条前往

页

蔡岳毅基于 ClickHouse StarRocks 构建支撑千亿数据数据量可用查询引擎苏宁用户画像场景实践众安

分类

语言

格式

蔡岳毅-基于ClickHouse+StarRocks构建支撑千亿级数据量的高可用查询引擎

4. ClickHouse在苏宁用户画像场景的实践

6. ClickHouse在众安的实践