PromQL 从入门到精通生态里,时序数据的标识,就是一堆标签集合,所以这里的过滤,就 是针对标签做过滤,支持四类操作符: =:完全匹配,比如 app="clickhouse" !=:完全不匹配,比如 app!="clickhouse" =~:正则匹配,比如 app=~"n9e-.*" !~:正则不匹配,比如 app!~"n9e-.*" 指标名称,通常放到大括号之外,但实际上,指标名称也是一个标签,其标签Key是 app="clickhouse"} 仍然可以达成相同的效果。有时采集的监控数据格式设计的不好,一些本该用 label 的信息,放 到了 metric 名称中了,此时就可以用 __name__ 做一些正则匹配。 Offset 监控系统里,经常会有同环比的需求,比如,当前的值相比一周之前,是否有巨大变化,那怎么 才能获取历史数据呢?可以使用 offset 关键字。 offset 后面跟一个时间段,比如 如上的方法,其实就是告警引擎的核心逻辑。告警规则里会要求用户配置promql以及执行频 率,告警引擎就会根据执行频率周期性执行,每次执行的时候就是拿着promql去查询,promql 中带有阈值,即上例中的 <60,所以如果所有机器的内存可用率都很高,比如维持在80~90, 那这个promql是不会返回查询结果的,此时监控系统就认为一切正常。如果返回了结果,比如 上例中返回了3条结果,告警引擎就会认为有异常产生,生成3个告警事件。0 码力 | 16 页 | 2.77 MB | 1 年前3
告警OnCall事件中心建设方法白皮书
单下。监控系统通过 Webhook 发给「全局集成」的告警事件,怎么进入协作空间的呢?通过在协作空 间里配置订阅规则。 订阅规则 订阅规则是一些过滤条件(通过事件标签、属性等),用于匹配告警事件,匹配到的告警事件,自动进入 这个协作空间。 比如:根据标签 来过滤告警事件, 把过滤到的告警事件订阅到“支付”协作空间。在“私有云”协作空 间创建订阅规则,根据标签 来过滤告警事件,0 码力 | 23 页 | 1.75 MB | 1 年前3
共 2 条
- 1













