告警OnCall事件中心建设方法白皮书
显,其次就是告警分级原则。 每个告警都应该合理分级 基本每个监控系统都支持为告警规则配置不同的级别,基本上每个监控系统的用户也都知道应该做分级告 警。但是具体怎么分级,却没有一个行业共识,大家各做各的。这里我也分享一下我的理解,你可以参考 借鉴。 首先,不同级别的告警应该对应不同的处理逻辑,这样分级才有意义,比如通知渠道不同,通知范围不 同,或者介入处理的人的范围不同,处理时效不同 中的告 警和故障建立完美的对应关系,不过从降噪收敛角度来看,够用了。 3、根据时间 + 文本相似度做收敛 文本相似度需要引入算法,但是算法总得有个规律,我们很想把某个故障相关的告警聚拢到一起,但是显 然,很难有个行之有效的规律,没有规律的算法效果自然好不到哪儿去。 既然没办法把告警自动收敛成故障,那就手工来做。一个故障关联的关键告警,还是相对容易区分的,只 要把关键告 告警聚合 事件到告警的聚合比较容易,通常是用类似下面的算法来计算不同事件的关联关系: hash(32 + ["__name__=cpu_usage_idle", "host=host1"]) 这个值姑且称为事件 Hash,相同 Hash 的事件就被聚合为一条告警。更复杂的是告警到故障的合并,当 前我们支持基于规则的聚合,后面会基于算法聚合: 比如基于告警规则标题做聚合,某一时刻,基础网络故障,有0 码力 | 23 页 | 1.75 MB | 1 年前3
openEuler 23.09 技术白皮书年 9 月 30 日,全新 openEuler 21.09 创新版如期而至,这是欧拉全新发布后的第一个社区版本,实现了全场景 支持。增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术; 同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler CFS 调度类抢占、选核、选任务等功能的策略扩展, 提供精心设计的扩展点和丰富的辅助方法,帮助用户简单,高效的扩展策略。 • Numa Aware spinlock:基于 MCS 自旋锁在锁传递算法上针对多 NUMA 系统优化,通过优先在本 NUMA 节点内传递, 能大量减少跨 NUMA 的 Cache 同步和乒乓,从而提升锁的整体吞吐量,提升业务性能。 • 支持 TCP 压缩:大数据等场 的出现很好的 弥补了 K8S 流量编排的缺陷,与 K8S 互补,真正实现敏捷的云应用开发运维。但随着对服务网格应用的逐步深入,当前服 务网格的代理架构,数据面引入了额外的时延底噪开销,已成为业界共识的性能问题。 时延 以服务网格典型软件 istio 为例,网格化后,服务访问单跳时延增加 2.65ms,无法满足时延敏感型应用诉求。 底噪 istio 中,每个 sidecar 软件占用内存0 码力 | 52 页 | 5.25 MB | 1 年前3
大学霸 Kali Linux 安全渗透教程Linux; Kali更新与升级; 基本设置。 大学霸 Kali Linux 安全渗透教程 5 第1章 Linux安全渗透简介 1.1 什么是安全渗透 渗透测试并没有一个标准的定义。国外一些安全组织达成共识的通用说法是,渗透 测试是通过模拟恶意黑客的攻击方法,来评估计算机网络系统安全的一种评估方 法,这个过程包括对系统的任何弱点、技术缺陷或漏洞的主动分析。这个分析是从 一个攻击者可能存在的位置来进行的 具是一款开源的绿色加密卷加密 软件,不需要生成任何文件即可在硬盘上建立虚拟磁盘。用户可以按照盘符进行访 问,所以虚拟磁盘上的文件都被自动加密,访问时需要使用密码解密。TrueCrypt 提供多种加密算法,包括AES、Serpent、Twofish、AES-Twofish和AES-Twofish- Serpent等。本节将介绍TrueCrypt工具的使用。 2.5.1 创建加密目录 使用True Location (7)在该界面可以看到前面创建的卷的名称和位置。然后单击Next按钮,将显示 如图2.12所示的界面。 图2.12 Encryption Options (8)在该界面选择加密算法,这里选择默认的加密算法AES,然后单击Next按 钮,将显示如图2.13所示的界面。 大学霸 Kali Linux 安全渗透教程 80 2.5 目录加密 图2.13 Volume Size (9)在该0 码力 | 444 页 | 25.79 MB | 1 年前3
Debian 新维护者手册GNU Software (http://www.gnu.org/prep/maintain/html_node/- index.html) 。尽管 Debian 不要求遵守这些规范,但它们作为纲领和共识仍然很有帮助。(参见 /usr/share/doc/ gnu-standards/standards.pdf.gz 和 /usr/share/doc/gnu-standards/maintain.pdf 请确认该共享库软件包仅仅包含预期中的文件,并且你的 -dev 软件包还奏效。 所有作为多体系结构软件包而同时安装到同一个文件路径的所有文件应当具有完全一致的文件内容。你必须小心由数 据字节序和压缩算法造成的区别。 A.5 Debian 本土软件包 如果一个软件包是仅仅为 Debian 维护的,或者是可能的本地使用,那么它的源码可以容纳所有的 debian/* 于其中。 这里有它的两种打包方式。0 码力 | 63 页 | 493.28 KB | 1 年前3
openEuler 22.03-LTS 技术白皮书年 9 月 30 日,全新 openEuler 21.09 创新版如期而至,这是欧拉全新发布后的第一个社区版本,实现了全场景 支持。增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术;同 时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 面向未来,社区将持续创新、社区共建、繁荣生态,夯实数字基座。 引领内核创新 • 云原生调度增强:针对云场景在线和离线业务混合部署场景,创新 CPU 调度算法,保障在线业务对 CPU 的实时抢占 及抖动抑制,创新业务优先级 OOM 内存回收算法,保障在线业务安全可靠运行。 • 新文件系统 EulerFS:面向非易失性内存的新文件系统,采用软更新、目录双视图等技术减少文件元数据同步时间, 提升文件读写性能。 内核中的新特性 openEuler 22.03 LTS 基于 Linux Kernel 5.10 内核构建,在此基础上,同时吸收了社区高版本的有益特性及社区创新 特性: • 进程调度优化:优化进程负载均衡算法,减少负载均衡过程中的开销,提升性能。 • 内核动态抢占:新增启动选 preempt=none/voluntary/full,允许内核动态切换抢占模式。 • mremap 性能优化:通过移动 PMD/PUD0 码力 | 17 页 | 6.52 MB | 1 年前3
openEuler 22.09 技术白皮书年 9 月 30 日,全新 openEuler 21.09 创新版如期而至,这是欧拉全新发布后的第一个社区版本,实现了全场景支持。 增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术;同时发布边 缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 面向未来,社区将持续创新、社区共建、繁荣生态,夯实数字基座。 引领内核创新 • 云原生调度增强:针对云场景在线和离线业务混合部署场景,创新 CPU 调度算法保障在线业务对 CPU 的实时抢占及 抖动抑制,创新业务优先级 OOM 内存回收算法保障在线业务安全可靠运行。 • 新文件系统 EulerFS:面向非易失性内存的新文件系统,采用软更新、目录双视图等技术减少文件元数据同步时间,提 升文件读写性能。 Linux 提供了 Rust 相关的基础设施和方便编写 Linux 驱动的框架。 • 支持程序代码段大页特性:可以减少 TLB Miss,提升应用性能。 • 支持 SM3/SM4 等商密算法加速。 • 模块签名支持商密算法。 可编程内核 基于 eBPF 的可编程调度框架,支持内核调度器动态扩展调度策略,以满足不同负载的性能需求,具备以下特点: 1. 标签管理机制,开放对任务和任务组进行标签标记的0 码力 | 13 页 | 1.39 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践无监督异常检测算法 (自编码器) 原始数据 生成数据 单维时间序列分析 无监督异常检测算法 (N-Sigma) 单维时间序列分析 有监督异常检测算法 (特征工程) 时间序列的统计特征 • 最大值,最小值,值域 • 均值,中位数 • 方差,偏度,峰度 • 同比,环比,周期性 • 自相关系数,变异系数 时间序列的拟合特征 • 移动平均算法 • 带权重的移动平均算法 • 指数移动平均算法 指数移动平均算法 • 二次指数移动平均算法 • 三次指数移动平均算法 • 奇异值分解算法 • 自回归算法 • 深度学习算法 时间序列的分类特征 • 熵特征 • 值分布特征 • 小波分析特征 单维时间序列分析 有监督异常检测算法 (RF,GBDT,XGBoost,深度学习) 数据层 数据存储 数据提取 统计算法 输出疑似异常 无监督算法 输出疑似异常 有监督算法 特征工程 判断时间序列是否波动 人工查找可疑维度 人工查找可疑元素 1 2 3 人工分析异常维度 数据存储 多维时间序列 异常检测 多模型融合 正负样本 业务场景 特征工程 连续特征 离散特征 有监督算法 输出规则 多维时间序列分析 智能多维下钻分析 发现问题 分析问题 1 2 多维时间序列分析 成功率 运营商 操作系统 客户端版本 网络类型 图片数量 99.9% 移动 安卓 XXX10 码力 | 28 页 | 1.88 MB | 1 年前3
openEuler 22.03 LTS SP2 技术白皮书30 日,全新 openEuler 21.09 创新版如期而至,这是 openEuler 全新发布后的第一个社区版本,实现了 全场景支持。增强服务器和云计算的特性,发布面向云原生的业务混部CPU调度算法、容器化操作系统KubeOS等关键技术; 同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 技术动态感知业务的负载变化调节业务 CPU 范围,负载低时使用优先 CPU,增强资源局部性;负载高时 突破优先 CPU 的限制,利用共享 CPU 来提升 QoS。 功能描述 group1 默认调度算法 group2 cpu 0-7 潮汐affinity 优势: cpu使用率高 劣势: Cache等资源干扰严重 内核无效切换底噪高 技术方案:根据业务亲和性动态 绑核,负载高时突破绑核范围 人应用程序。从驱动程序到算法,开发工具, ROS 把原本松散的零部件耦合在了一起,为开发者们提供了通信架构。ROS 虽然叫做操作系统,但并非传统意义的操作系统, 它只是连接了操作系统和开发者的 ROS 应用程序,所以它是一个中间件,基于 ROS 的应用程序之间建立起了沟通的桥梁, 所以也是运行在 Linux 上的运行时环境,在这个环境上,机器人的感知、决策、控制算法可以更好的组织和运行。 本特性提供了基于0 码力 | 48 页 | 5.62 MB | 1 年前3
openEuler 21.09 技术白皮书2021年 9 月 30 日,全新openEuler 21.09创新版如期而至,这是欧拉全新发布后的第一个社区版本,实现了全场景支持。 增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术;同时发布 边缘和嵌入式版本。 openEuler 作为一个操作系统发行版平台,每两年推出一个 LTS 版本。该版本为企业级用户提供一个安全稳定可靠的 争力探索,打造全场景协同的面向数字基础 设施的开源操作系统。 引领内核创新 云原生调度增强:针对云场景在线和离线业务混合部署场景,创新 CPU 调度算法保障在线业务对 CPU 的实时抢占及抖动 抑制,创新业务优先级 OOM 内存回收算法保障在线业务安全可靠运行。 • 新文件系统 EulerFS:面向非易失性内存的新文件系统,采用软更新、目录双视图等技术减少文件元数据同步时间, 提升文件读写性能。 内核构建 , 在进程调度、内存管理、网络等方面带来 12 处如下创新: 01 02 03 04 05 06 07 08 09 10 11 12 进程调度优化:优化进程负载均衡算法, 减少负载均衡过程中的开销,提升性能; 内核动态抢占:新增启动选 preempt=none/voluntary/full,允许 内核动态切换抢占模式。 mremap 性能优化:通过移动 PMD/PUD0 码力 | 35 页 | 3.72 MB | 1 年前3
openEuler 24.03 LTS 技术白皮书月 30 日,全新openEuler 21.09创新版如期而至,这是openEuler全新发布后的第一个社区版本,实现了全场景支持。 增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术;同时发布边缘和 嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 虚拟机动态扩容。 • 负载算力协同:在多核服务器中运行用户体验敏感应用(如云桌面系统)时,通过负载算力协同技术能够保障算力供给的及时 性和有效性。负载算力协同技术具有以下特性:高负载场景下,支持轻量级的任务搜索算法,提高空闲 CPU 拉取 runnable 任 务的效率,实现多核间快速负载均衡,最大化 CPU 资源利用率;算力竞争场景下,支持按优先级对业务进行分级管控,有效 避免优先级翻转的问题,实现高优 • 高可用 针对 MGR 进行了大量改进和提升工作,新增支持地理标签、仲裁节点、读写节点可绑定动态 IP、快速单主模式、智能选主, 并针对流控算法、事务认证队列清理算法、节点加入 & 退出机制、recovery 机制等多项 MGR 底层工作机制算法进行深度优化, 进一步提升优化了 MGR 的高可用保障及性能稳定性。 - 支持地理标签特性,提升多机房架构数据可靠性。 - 支持仲裁节点特性,用更低的服务器成本实现更高可用。0 码力 | 45 页 | 6.18 MB | 1 年前3
共 53 条
- 1
- 2
- 3
- 4
- 5
- 6













