 ClickHouse在B站海量数据场景的落地实践HDFS/Hive Kafka/Databus 离线接入 (Rider/Spark/WaterDrop) 实时接入 (BSQL/Saber/Flink & ClickHouse JDBC) Applications 用户程序 Flink/JDBC/Go/HTTP 标签圈人 。。。 广告DMP 内容定投 内容分析 日志&Trace 平台 APM ClickHouse as Service0 码力 | 26 页 | 2.15 MB | 1 年前3 ClickHouse在B站海量数据场景的落地实践HDFS/Hive Kafka/Databus 离线接入 (Rider/Spark/WaterDrop) 实时接入 (BSQL/Saber/Flink & ClickHouse JDBC) Applications 用户程序 Flink/JDBC/Go/HTTP 标签圈人 。。。 广告DMP 内容定投 内容分析 日志&Trace 平台 APM ClickHouse as Service0 码力 | 26 页 | 2.15 MB | 1 年前3
 4. ClickHouse在苏宁用户画像场景的实践ES中定义标签的大宽表  通过Spark关联各种业务数据,插入到ES大 宽表。  高频查询的画像数据通过后台任务保存到加 速层:Hbase 戒者 Redis  实时标签通过Flink计算,然后写入Redis  用户画像平台可以从ES、Hbase、Redis查 询数据 痛点:  标签导入到ES的时间过长,需要等待各种业 务数据准备就绪,才能迚行关联查询。  新增戒者修改标签,丌能实时迚行,涉及到 ES文档结构的变化。  ES对资源消耗比较大,属亍豪华型配置。  ES的DSL诧法对用户丌太友好,用户学习成 本高。 Kafka Flink 18 ClickHouse替换ES存储标签数据  ClickHouse Manager负责ClickHouse集群管理、元数据管理以及节点负载协调  tag-generate0 码力 | 32 页 | 1.47 MB | 1 年前3 4. ClickHouse在苏宁用户画像场景的实践ES中定义标签的大宽表  通过Spark关联各种业务数据,插入到ES大 宽表。  高频查询的画像数据通过后台任务保存到加 速层:Hbase 戒者 Redis  实时标签通过Flink计算,然后写入Redis  用户画像平台可以从ES、Hbase、Redis查 询数据 痛点:  标签导入到ES的时间过长,需要等待各种业 务数据准备就绪,才能迚行关联查询。  新增戒者修改标签,丌能实时迚行,涉及到 ES文档结构的变化。  ES对资源消耗比较大,属亍豪华型配置。  ES的DSL诧法对用户丌太友好,用户学习成 本高。 Kafka Flink 18 ClickHouse替换ES存储标签数据  ClickHouse Manager负责ClickHouse集群管理、元数据管理以及节点负载协调  tag-generate0 码力 | 32 页 | 1.47 MB | 1 年前3
 6. ClickHouse在众安的实践预测分析与机器学习 CHAPTER 众安集智平台与clickhouse 02 集智平台 X-Brain AI 开放平台 计算框架 Hadoop, JStorm, Spark Streaming, Flink 离线/实时任务监控 数据、模型存储 Hive, HBase, Clickhouse, Kylin 数据接入 消 息 中 间 件 模型、 算法 模版 机器学习平台 Antron 机器人平台0 码力 | 28 页 | 4.00 MB | 1 年前3 6. ClickHouse在众安的实践预测分析与机器学习 CHAPTER 众安集智平台与clickhouse 02 集智平台 X-Brain AI 开放平台 计算框架 Hadoop, JStorm, Spark Streaming, Flink 离线/实时任务监控 数据、模型存储 Hive, HBase, Clickhouse, Kylin 数据接入 消 息 中 间 件 模型、 算法 模版 机器学习平台 Antron 机器人平台0 码力 | 28 页 | 4.00 MB | 1 年前3
共 3 条
- 1













