 B站统⼀监控系统的设计,演进
与实践分享能覆盖⼤大部分监控场景 • 固定⼏几种数据类型 ✦ Counter ✦ Gauge ✦ 等.. • 时序数据 ✦ 具有统计特性 ✦ 具有规律律性 metric数据特征 选型原则 • 基于开源⽅方案,⼆二次开发 • 具备现代时间序列列数据库的特性 • 活跃项⽬目,具有成熟的⽣生态环境 结论 • prometheus • ⽀支持任意维度label • cncf基⾦金金会0 码力 | 34 页 | 650.25 KB | 1 年前3 B站统⼀监控系统的设计,演进
与实践分享能覆盖⼤大部分监控场景 • 固定⼏几种数据类型 ✦ Counter ✦ Gauge ✦ 等.. • 时序数据 ✦ 具有统计特性 ✦ 具有规律律性 metric数据特征 选型原则 • 基于开源⽅方案,⼆二次开发 • 具备现代时间序列列数据库的特性 • 活跃项⽬目,具有成熟的⽣生态环境 结论 • prometheus • ⽀支持任意维度label • cncf基⾦金金会0 码力 | 34 页 | 650.25 KB | 1 年前3
 PromQL 从入门到精通absent_over_time 接收一个 range-vector,如果range-vector是空,则返回1,表示absent,如果range-vector 有内容,则什么都不返回。 这个特性在生产环境下可以用作nodata告警,比如: absent_over_time(system_load_norm_1{ident="tt-fc-dev02.nj"}[5m]) 这个promql表示,tt-fc-dev020 码力 | 16 页 | 2.77 MB | 1 年前3 PromQL 从入门到精通absent_over_time 接收一个 range-vector,如果range-vector是空,则返回1,表示absent,如果range-vector 有内容,则什么都不返回。 这个特性在生产环境下可以用作nodata告警,比如: absent_over_time(system_load_norm_1{ident="tt-fc-dev02.nj"}[5m]) 这个promql表示,tt-fc-dev020 码力 | 16 页 | 2.77 MB | 1 年前3
 告警OnCall事件中心建设方法白皮书
的告警事件,就需要创建一个 Nightingale 类型的集成(Integration),点击上例中的 “支付”协作空间,进入协作空间详情,其中有个【集成数据】的入口: 上例中我已经创建过多个集成了,你的环境是新的,只需要点击【+新增一个集成】,选择集成类型,随便 输入一个集成名称,就可以创建一个集成。 创建完了集成之后,点击这个集成查看详情,会看到一个专属的 URL,以及相关的接入文档,去监控系0 码力 | 23 页 | 1.75 MB | 1 年前3 告警OnCall事件中心建设方法白皮书
的告警事件,就需要创建一个 Nightingale 类型的集成(Integration),点击上例中的 “支付”协作空间,进入协作空间详情,其中有个【集成数据】的入口: 上例中我已经创建过多个集成了,你的环境是新的,只需要点击【+新增一个集成】,选择集成类型,随便 输入一个集成名称,就可以创建一个集成。 创建完了集成之后,点击这个集成查看详情,会看到一个专属的 URL,以及相关的接入文档,去监控系0 码力 | 23 页 | 1.75 MB | 1 年前3
共 3 条
- 1













