降级预案在同程艺龙的工程实践-王俊翔业务保障管理理后台 应⽤用JVM进程 故障动态注⼊入 Attach 故障注⼊入 指标聚合查询 熔断降级计算(Flink) ⽇日志中⼼心 KAFKA 数据采集、计算、存储 指标(HBase) 指标明细(ES) 降级⽇日志(ES) ETL 指标计算(Flink) 脚本引擎 查 询 服 务 ⽇日志数据 指标(Redis) 业务异常数据快照(ES) 熔断降级通知 降级服务管理理 指标规则计算 指标脚本 规则表达式 熔断 降级 条件 计算 降级消息 数据 存储 实时告警 规则配置 开发 ⽇日志解析规则 控制中⼼心 ETCD 降级服务 降级处理理 流处理理集群(Flink) HBase ES Redis 落地存储 数据服务 数据平台 实时告警 告警策略略 指标查询 指标脚本开发 指标配置 产品化 开发 复合指标计算如何处理理 ServiceA0 码力 | 26 页 | 18.67 MB | 1 年前3
2022年美团技术年货 合辑以上的搜索浏览超过一页结果)。云端的排序系统无法及时感知用户的兴趣变化,并 调整已下发到客户端的结果顺序。 图 2 分页浏览决策示意图 ② 实时反馈信号感知延迟 一般来说,实时反馈信号会通过 Storm、Flink 等流处理平台,将日志流以 Mini- batch 的方式计算后,存入 KV 特征数据库供搜索系统模型使用。这种方式往往会有 分钟级的特征延迟,因为需要对反馈数据进行解析处理,当涉及到更多、更复杂的反 在数据处理框架的技术选型上,我们先后考虑了三种方案,分别是传统架构(Java 应用)、Storm 架构、Flink 架构,这三种方案在不同维度的对比数据如下: 方案 成熟度 稳定性 扩展性 容错性 延迟 吞吐量 开发成本 运维成本 传统架构 高 高 低 低 高 低 高 高 Storm 架构 高 中 高 高 中 中 中 中 Flink 架构 中 中 高 高 低 高 中 中 表 1 技术选型对比表 综合来看,虽然 综合来看,虽然传统架构有比较好的成熟度与灵活性,但是在扩展性、容错性以及性 能上均不能满足系统要求,而 Flink 架构与 Storm 架构都有比较优秀的扩展性与容错 性,但是 Flink 架构在延迟与吞吐量上表现要更好,因此我们最终选择了使用 Flink 架构作为数据处理框架。 Flink:业内领先的流式计算引擎,具有高吞吐、低延迟、高可靠和精确计算等优点, 对事件窗口有很好的支持,被业内很多公司作为首选的流式计算引擎。0 码力 | 1356 页 | 45.90 MB | 1 年前3
海尔实时计算平台技术选型与实践Scribe ZeroMQ ActiveMQ Logstash RabbitMQ Jafka RabbitMQ Storm JStrom Samza Heron Spark Flink Ganglia Sqoop zeppelin Saiku Caravel CBoard Nagios 实时数据采集技术选型要求 • 完整 • 低延时 • 不影响业务系统性能 代码埋点: rone Kafka web监控管理界面 流式计算可选方案 仅流处理框架: • Storm • JStorm • Samza • Heron 混合框架: • Spark • Flink Core Storm or Storm Trident? Storm Trident: • Batch • Exactly-once 选型考虑 : • 性能 • 状态 Storm流式日志处理常见架构0 码力 | 41 页 | 3.21 MB | 1 年前3
1_丁来强_开源AIOps数据中台搭建与Python的作用聚合结果要在⼀一台机器器内存内 • 缺少完整更更新删除操作 • ⽀支持操作系统有限 ⼤大数据⽅方案开源全景图(部分)与Python作⽤用 • 数据治理理:Python ETL、PySpark、Flink/Blink-Python • 机器器学习:Airflow(编排)+ 如下机器器学习框架 • ⾃自动化:Ansible、Puppet等 • AI增强 - 降噪去重与模式识别 • 对0 码力 | 48 页 | 17.54 MB | 1 年前3
共 4 条
- 1













