告警OnCall事件中心建设方法白皮书
很多监控系统都可以配置 Webhook,当告警触发之后自动回调某个 HTTP 接口,来串联一些自动化的 逻辑,让告警事件无人值守自动处理。比如某个机房的某个服务挂掉了,Webhook 的逻辑是自动调用切 流的接口,把服务流量切走,这样来达到止损的目的。 告警自动处理的这段逻辑,未必一定能够做到告警自愈,有的时候只是使用这个机制来抓现场,也是非常 有价值的。比如某个进程挂掉了,在挂掉0 码力 | 23 页 | 1.75 MB | 1 年前3
OpenMetrics - Standing on the shoulders of Titansimplementation RFC currently blocked on me finding time Prometheus: experimental support since 2.5.0 Python client library: experimental support since 0.4.0 Test your own OM output: robustperception.io/ch0 码力 | 21 页 | 84.83 KB | 1 年前3
Prometheus Deep Dive - Monitoring. At scale.Independent CNCF member project, IETF RFC, test suite, etc We are writing code in Prometheus and the Python client library https://github.com/OpenObservability/OpenMetrics Prometheus 2.5 has experimental0 码力 | 34 页 | 370.20 KB | 1 年前3
共 3 条
- 1













