1.6 利用夜莺扩展能力打造全方位监控系统稳定性体系一定要重视起来,而监控,就是稳定性体系中至 关重要的一环 运维监控需求来源 01.监控的原始需求来自业务稳定性 左图是2013年的一个新闻,讲 Google宕机的影响。2020年也出现 过aws大规模宕机的情况,影响不 止是55万美元,直接影响大半个 互联网! 2018年有美国调研机构指出,如 果服务器宕机1分钟,银行会损失 27万美元,制造业会损失42万美 元 美团故障?滴滴故障?腾讯故障?0 码力 | 40 页 | 3.85 MB | 1 年前3
OpenMetrics - Standing on the shoulders of Titanscurrently blocked on me finding time Prometheus: experimental support since 2.5.0 Python client library: experimental support since 0.4.0 Test your own OM output: robustperception.io/checking-openmetrics-output-is-valid0 码力 | 21 页 | 84.83 KB | 1 年前3
Prometheus Deep Dive - Monitoring. At scale.member project, IETF RFC, test suite, etc We are writing code in Prometheus and the Python client library https://github.com/OpenObservability/OpenMetrics Prometheus 2.5 has experimental OpenMetrics support0 码力 | 34 页 | 370.20 KB | 1 年前3
共 3 条
- 1













