B站统⼀监控系统的设计,演进
与实践分享offset 7d 告警规则: 预测业务A请求量量异常 异常响应 todo • 异常事件关联关系挖掘 • 全联路路模块调⽤用分析 • 瓶颈分析 针对历史事件 针对当前事件 • 异常检查(动态阈值) • 异常定位(根因分析) • 快速⽌止损 针对未来事件 • 故障预测 • 容量量预测 • 趋势预测 Thank You! 哔哩哔哩 - ( ゜- ゜)つロ 乾杯~0 码力 | 34 页 | 650.25 KB | 1 年前3
PromQL 从入门到精通ave_sql_running == 0 and ON (instance) mysql_slave_status_master_server_id > 0 这个promql想表达的意思是如果这个mysql实例是个slave(master_server_id>0),则检查其 slave_sql_running的值,如果slave_sql_running==0表示slave sql线程没有在运行。 sql线程没有在运行。 但是mysql_slave_status_slave_sql_running和mysql_slave_status_master_server_id这两个 metric的标签可能并非完全一致,不过好在二者都有个instance标签,且相同instance标签的数 据从语义上来看就表示一个实例的多个指标数据,那就可以用on关键字,指定只使用instance 标签做匹配,忽略其他标签。0 码力 | 16 页 | 2.77 MB | 1 年前3
Intro to Prometheus - With a dash of operations & observability@fredbrancz Intro to Prometheus Introduction Background Operations & observability Outro PromQL vs SQL avg by(city) (temperature_celsius{country=" germany" }) SELECT city, AVG(value) FROM temperature_celsius0 码力 | 19 页 | 63.73 KB | 1 年前3
共 3 条
- 1













