【05 计算平台 蓉荣】Flink 批处理及其应⽤Flink 批处理理及其应⽤用 What is Apache Flink * Apache Flink 是⼀一个分布式⼤大数据处理理引擎 * 可对有限数据流和⽆无限数据流进⾏行行有状态计算 * 可部署在各种集群环境 * 对各种⼤大⼩小的数据规模进⾏行行快速计算 为什什么Flink能做批处理理 Table Stream Bounded Data Unbounded Data0 码力 | 12 页 | 1.44 MB | 1 年前3
Apache Flink的过去、现在和未来Flink的过去、现在和未来 杨克特(鲁尼) 阿里巴巴高级技术专家 过去 一切从2014年开始 2009 - 2014 2014 • 柏林工业大学博士生项目 • 基于流式 runtime 的批处理引擎 • 2014 年 8 月份 发布 Flink 0.6.0 Flink 0.7 Runtime Distributed Streaming Dataflow DataStream API 丰富的 State API。 ValueState, ListState, MapState BroadcastState。 支持基于事件时间的计 算,实现 Watermark 机 制。乱序数据处理,迟 到数据容忍。 开箱即用的滚动、滑 动、会话窗口。以及 灵活的自定义窗口。 State Time Window 2015 年阿里巴巴开始使用 Flink 并持续贡献社区 重构分布式架构0 码力 | 33 页 | 3.36 MB | 1 年前3
Flink如何实时分析Iceberg数据湖的CDC数据2、无在k服务。l护和运nS本低。 2、D存存储,Ca速O快。 3、方便上S3 OSS,超高性价比。 方案s估 优点 1、增量和全量表割p,时效性不足。 2、r计和l护额外hChang+ S+4表。 3、计算引擎并非原g支UCDC。 4、不支U实时U13+24。 缺点 为何选择 #+ink Iceberg ? #2 Flink 原生支持 C C 数据消费 ebezium 1lHLI W生支持0 码力 | 36 页 | 781.69 KB | 1 年前3
共 3 条
- 1













