Hadoop 迁移到阿里云MaxCompute 技术方案MaxCompute 解决方案 8 实时消息采集:用于实时数据采集,可扩展、高吞吐、可靠的消息服务。如 Kafka。 流处理:对实时数据进行低延迟流式计算的服务。如 Flink、Spark Streaming、Storm 等。 机器学习:满足机器学习工作负载的服务。如当前流行的 Spark MLib/ML、Tensorflow 等。 分析型数据存储: MaxCompute Spark 实时消息采集 Kafka Datahub 日志服务(LogHub 组件) 消息队列 Kafka 流处理 Spark Streaming Flink Storm 实时计算(原流计算) EMR(开源流计算组件) 分析型数据存储 数据仓库: GreenPlum/Impala/Presto/Hive NoSQL:Hbase GraphX MaxCompute Graph 流式采集 Kafka Datahub,流式数据投递至 MaxCompute 日志服务,流式数据投递至 MaxCompute 流计算 Flink/Storm/Spark Streaming 不支持,需迁移至阿里云实时计算、EMR 流计算 组件或自建流计算服务 存储 HDFS/Hive 数据存储 MaxCompute Table0 码力 | 59 页 | 4.33 MB | 1 年前3
共 1 条
- 1













