 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 单维时间序列分析 海量时间序列 业务场景复杂 规则配置繁琐 1 1 2 3 时间序列异常检测 如何找到通用的解决方案? 单维时间序列分析 规则类告警策略 最大值告警 最小值告警 波动率告警 单维时间序列分析 无监督异常检测算法 (自编码器) 原始数据 生成数据 单维时间序列分析 无监督异常检测算法 (N-Sigma) 单维时间序列分析 有监督异常检测算法 (特征工程) 时间序列的统计特征 • 最大值,最小值,值域 • 均值,中位数 人工查找可疑维度 人工查找可疑元素 1 2 3 人工分析异常维度 数据存储 多维时间序列 异常检测 多模型融合 正负样本 业务场景 特征工程 连续特征 离散特征 有监督算法 输出规则 多维时间序列分析 智能多维下钻分析 发现问题 分析问题 1 2 多维时间序列分析 成功率 运营商 操作系统 客户端版本 网络类型 图片数量 99.9% 移动 安卓 XXX1 4G 30 码力 | 28 页 | 1.88 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 单维时间序列分析 海量时间序列 业务场景复杂 规则配置繁琐 1 1 2 3 时间序列异常检测 如何找到通用的解决方案? 单维时间序列分析 规则类告警策略 最大值告警 最小值告警 波动率告警 单维时间序列分析 无监督异常检测算法 (自编码器) 原始数据 生成数据 单维时间序列分析 无监督异常检测算法 (N-Sigma) 单维时间序列分析 有监督异常检测算法 (特征工程) 时间序列的统计特征 • 最大值,最小值,值域 • 均值,中位数 人工查找可疑维度 人工查找可疑元素 1 2 3 人工分析异常维度 数据存储 多维时间序列 异常检测 多模型融合 正负样本 业务场景 特征工程 连续特征 离散特征 有监督算法 输出规则 多维时间序列分析 智能多维下钻分析 发现问题 分析问题 1 2 多维时间序列分析 成功率 运营商 操作系统 客户端版本 网络类型 图片数量 99.9% 移动 安卓 XXX1 4G 30 码力 | 28 页 | 1.88 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏检、电子工单、运营分析、运营 管控、经营管理等。 落地企业工具文化。 回顾一下传统烟囱式模式的弊端 …… 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集 视图 自助 发布 临时 活动 流程 系统 老板 视图 配置 刷新 周报 邮件 业务 门户 ...... 十年发展 2008-2012 • 烟囱自动化 2012-2015 • 调度自动化 • 运维PaaS 2015-2017 • 数据运维 • 运维运营PaaS 2017-2019 • DevOps • AIOps • 研发运维运营一体化 01 蓝鲸技术运营PaaS体系 企业IT对象:服务器、存储、网络、虚拟化、私有云、公有云、混合云、超融合、容器、业务应用、基础服务 运维自动化 数据中心自 动化 应用运维自 动化 业务运维自 动化 CMP 跨系统编排 与调度 运行监控和故障管理 第三方监控接入 基础监控 采集 存储 检测 告警 故障自愈 蓝鲸平台 管控平台 PaaS平台:开发框架/API集成 统一配置管理 模型定义 自动采集 配置维护0 码力 | 26 页 | 8.25 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏检、电子工单、运营分析、运营 管控、经营管理等。 落地企业工具文化。 回顾一下传统烟囱式模式的弊端 …… 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集 视图 自助 发布 临时 活动 流程 系统 老板 视图 配置 刷新 周报 邮件 业务 门户 ...... 十年发展 2008-2012 • 烟囱自动化 2012-2015 • 调度自动化 • 运维PaaS 2015-2017 • 数据运维 • 运维运营PaaS 2017-2019 • DevOps • AIOps • 研发运维运营一体化 01 蓝鲸技术运营PaaS体系 企业IT对象:服务器、存储、网络、虚拟化、私有云、公有云、混合云、超融合、容器、业务应用、基础服务 运维自动化 数据中心自 动化 应用运维自 动化 业务运维自 动化 CMP 跨系统编排 与调度 运行监控和故障管理 第三方监控接入 基础监控 采集 存储 检测 告警 故障自愈 蓝鲸平台 管控平台 PaaS平台:开发框架/API集成 统一配置管理 模型定义 自动采集 配置维护0 码力 | 26 页 | 8.25 MB | 1 年前3
 Red Hat OpenShift GitOps 1.13 基础架构节点上的 GitOps 工作负载control plane 工作负载移到基础架构节点: 4. 可选:在基础架构节点上应用污点并隔离工作负载,并防止其他工作负载调度到这些节点上。 5. 可选: 如果您将污点应用到节点,您可以在 GitOpsService CR 中添加容限: 要验证工作负载是否已调度到 Red Hat OpenShift GitOps 命名空间中的基础架构节点上,请点击任何 pod 名称,并确保已添加了 Node 在 Subscription 资源的 spec.config 字段中添加 nodeSelector 和 tolerations : 订阅 订阅示例 示例 这样可确保 Operator pod 仅调度到基础架构节点上。 这样可确保基础架构节点接受 pod。 输 输出示例 出示例 4. 运行以下命令,验证 GitOps Operator pod 是否在基础架构节点上运行: 输 输出示例 出示例0 码力 | 10 页 | 122.25 KB | 1 年前3 Red Hat OpenShift GitOps 1.13 基础架构节点上的 GitOps 工作负载control plane 工作负载移到基础架构节点: 4. 可选:在基础架构节点上应用污点并隔离工作负载,并防止其他工作负载调度到这些节点上。 5. 可选: 如果您将污点应用到节点,您可以在 GitOpsService CR 中添加容限: 要验证工作负载是否已调度到 Red Hat OpenShift GitOps 命名空间中的基础架构节点上,请点击任何 pod 名称,并确保已添加了 Node 在 Subscription 资源的 spec.config 字段中添加 nodeSelector 和 tolerations : 订阅 订阅示例 示例 这样可确保 Operator pod 仅调度到基础架构节点上。 这样可确保基础架构节点接受 pod。 输 输出示例 出示例 4. 运行以下命令,验证 GitOps Operator pod 是否在基础架构节点上运行: 输 输出示例 出示例0 码力 | 10 页 | 122.25 KB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB DockerImage Docker Hub 跨地域、跨集群部署0 码力 | 26 页 | 2.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB DockerImage Docker Hub 跨地域、跨集群部署0 码力 | 26 页 | 2.39 MB | 1 年前3
 CloudExplorer 3.0 用户手册v1.2..................................................................................60 5.4 申请变更指定安全组规则和回收安全组............................................................... 62 5.5 申请虚拟机时指定安全组需求........ 安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于 设置云服务器、负载均衡、云数据库等实例的网络访问控制,控 制实例级别的出入流量,是重要的网络安全隔离手段。可以通过 配置安全组规则,允许或禁止安全组内的实例的出流量和入流 量。 弹性 IP 是私有云、公有云中租户能够申请获取保留专用的公网 IP 地址。 在私有云、公有云中,如果指定给虚拟机分配公网 IP,虚拟机停 止后再启动会自动分配一个新的公网 3-11 所示。 图 3-11 设置安全组 (3) 在【安全组设置】页面中,可选择【入方向】和【出方向】规则 TAB 标签页,打 开【入方向】选项卡修改入口规则、【出方向】选项卡则可以修改出口规则,如图 3-12 所示。 在选项卡中,  可点击【添加规则】按钮,添加安全组规则  可点击垃圾桶状按钮进行删除  可在可选安全组列表中选择要新增的安全组  添加申请原因 然后点击【提交】,等待管理员审批。0 码力 | 102 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 用户手册v1.2..................................................................................60 5.4 申请变更指定安全组规则和回收安全组............................................................... 62 5.5 申请虚拟机时指定安全组需求........ 安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于 设置云服务器、负载均衡、云数据库等实例的网络访问控制,控 制实例级别的出入流量,是重要的网络安全隔离手段。可以通过 配置安全组规则,允许或禁止安全组内的实例的出流量和入流 量。 弹性 IP 是私有云、公有云中租户能够申请获取保留专用的公网 IP 地址。 在私有云、公有云中,如果指定给虚拟机分配公网 IP,虚拟机停 止后再启动会自动分配一个新的公网 3-11 所示。 图 3-11 设置安全组 (3) 在【安全组设置】页面中,可选择【入方向】和【出方向】规则 TAB 标签页,打 开【入方向】选项卡修改入口规则、【出方向】选项卡则可以修改出口规则,如图 3-12 所示。 在选项卡中,  可点击【添加规则】按钮,添加安全组规则  可点击垃圾桶状按钮进行删除  可在可选安全组列表中选择要新增的安全组  添加申请原因 然后点击【提交】,等待管理员审批。0 码力 | 102 页 | 0 Bytes | 1 年前3
 CloudExplorer 3.0 管理员手册v1.2安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于设置云服 务器、负载均衡、云数据库等实例的网络访问控制,控制实例级别的出入 流量,是重要的网络安全隔离手段。可以通过配置安全组规则,允许或禁 止安全组内的实例的出流量和入流量。 弹性 IP 是私有云、公有云中租户能够申请获取保留专用的公网 IP 地址。在私有云、 公有云中,如果指定给虚拟机分配公网 IP,虚拟机停止后再启动会自动分 理功能进行配置 当需要支持中间件、数据机多机集群部署时 使用创建集群产品功能配置,创建集群产品功 能可定义虚拟机与脚本的组合编排任务支持 实现中间件、数据机多机集群部署。 需要配置主机名自动生成命名规则,用户侧申请 向导中的选项是否显示、是否必填,如是否允许 指定 SSH root 登录密码,是否可选择安全组时 可产品模版功能配置,配置各个云平台对应的 产品模版中的选项。 当需要配置用户侧申请向导中是否显示某些要选 账号登录密码,是否允许指定 安全组,是否允许创建弹性 IP  是否必须必选  选项的选择值范围, 比如 CPU、内存的可选最大值  选项的后台设定, 比如资源池放置策略、IP 分配策略、  主机名命名规则等  配置组织管理员、工作空间用户的选项可见及可修改权限  一般在初始化过程中可以先略过不配置,等初始化完毕后,再去修改各个云平台的 默认产品模版中的配置参数。 杭州飞致云信息科技有限公司0 码力 | 308 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 管理员手册v1.2安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于设置云服 务器、负载均衡、云数据库等实例的网络访问控制,控制实例级别的出入 流量,是重要的网络安全隔离手段。可以通过配置安全组规则,允许或禁 止安全组内的实例的出流量和入流量。 弹性 IP 是私有云、公有云中租户能够申请获取保留专用的公网 IP 地址。在私有云、 公有云中,如果指定给虚拟机分配公网 IP,虚拟机停止后再启动会自动分 理功能进行配置 当需要支持中间件、数据机多机集群部署时 使用创建集群产品功能配置,创建集群产品功 能可定义虚拟机与脚本的组合编排任务支持 实现中间件、数据机多机集群部署。 需要配置主机名自动生成命名规则,用户侧申请 向导中的选项是否显示、是否必填,如是否允许 指定 SSH root 登录密码,是否可选择安全组时 可产品模版功能配置,配置各个云平台对应的 产品模版中的选项。 当需要配置用户侧申请向导中是否显示某些要选 账号登录密码,是否允许指定 安全组,是否允许创建弹性 IP  是否必须必选  选项的选择值范围, 比如 CPU、内存的可选最大值  选项的后台设定, 比如资源池放置策略、IP 分配策略、  主机名命名规则等  配置组织管理员、工作空间用户的选项可见及可修改权限  一般在初始化过程中可以先略过不配置,等初始化完毕后,再去修改各个云平台的 默认产品模版中的配置参数。 杭州飞致云信息科技有限公司0 码力 | 308 页 | 0 Bytes | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission Webhook Node 超卖 HPAPlus HPAPlus • 一个HPA一个goroutine • 支持0 码力 | 10 页 | 1.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission Webhook Node 超卖 HPAPlus HPAPlus • 一个HPA一个goroutine • 支持0 码力 | 10 页 | 1.39 MB | 1 年前3
 FIT2CLOUD CloudExplorer 产品白皮书 v1.7归属关系管理(归属组织、项目、业务系统、人等) 支持 虚拟机实例操作(停止、启动、重启、释放) 支持 虚拟机实例生命周期配置变更、续期、回收管理 支持 虚拟机 SSH 登陆信息管理 支持 虚拟机命名规则规范管理 支持 公有云私有云安全组实例生命周期创建、变更、删除 支持 公有云私有云弹性 IP 实例生命周期创建、绑定、解绑、释放 支持 公有云私有云 RDS 实例生命周期创建、配置变更、回收 支持 云安全组在线申请部署及操作、变更、回收 应用开发测试、运维人员可查看其负责的各个项目下安全组列表以及各个安全组关联的 实例,并能够申请私有云、公有云安全组,指定查询条件查询安全组,查看指定安全组的安 全组规则,添加删除安全组规则;批量删除安全组; 其中查看查找安全组支持按云平台、云账号、地域、VPC 视图逐级查看查找; 对于 VMware,支持 NSX 防火墙。 目前支持 OpenStack、阿里云、腾讯云、华为云、AWS、Azure、华为  设置镜像的管理信息,包括操作系统、默认系统密码等 4) 安全组方面支持:  列表显示全部安全组、按云账号/地域/VPC 分级显示安全组  创建管理安全组  变更安全组,添加删除安全组规则 5) 弹性 IP 实例方面支持:  列表显示全部弹性 IP 及相关信息,是否空闲、绑定的虚拟机实例、带宽等  绑定到虚拟机实例、从虚拟机实例卸载  申请弹性 IP 6) 负载均衡实例方面支持:0 码力 | 60 页 | 0 Bytes | 1 年前3 FIT2CLOUD CloudExplorer 产品白皮书 v1.7归属关系管理(归属组织、项目、业务系统、人等) 支持 虚拟机实例操作(停止、启动、重启、释放) 支持 虚拟机实例生命周期配置变更、续期、回收管理 支持 虚拟机 SSH 登陆信息管理 支持 虚拟机命名规则规范管理 支持 公有云私有云安全组实例生命周期创建、变更、删除 支持 公有云私有云弹性 IP 实例生命周期创建、绑定、解绑、释放 支持 公有云私有云 RDS 实例生命周期创建、配置变更、回收 支持 云安全组在线申请部署及操作、变更、回收 应用开发测试、运维人员可查看其负责的各个项目下安全组列表以及各个安全组关联的 实例,并能够申请私有云、公有云安全组,指定查询条件查询安全组,查看指定安全组的安 全组规则,添加删除安全组规则;批量删除安全组; 其中查看查找安全组支持按云平台、云账号、地域、VPC 视图逐级查看查找; 对于 VMware,支持 NSX 防火墙。 目前支持 OpenStack、阿里云、腾讯云、华为云、AWS、Azure、华为  设置镜像的管理信息,包括操作系统、默认系统密码等 4) 安全组方面支持:  列表显示全部安全组、按云账号/地域/VPC 分级显示安全组  创建管理安全组  变更安全组,添加删除安全组规则 5) 弹性 IP 实例方面支持:  列表显示全部弹性 IP 及相关信息,是否空闲、绑定的虚拟机实例、带宽等  绑定到虚拟机实例、从虚拟机实例卸载  申请弹性 IP 6) 负载均衡实例方面支持:0 码力 | 60 页 | 0 Bytes | 1 年前3
 JumpServer ⼴受欢迎的开源堡垒机开源社区针对早期版 本的⽀持严重滞后。 版本升级 超⼤规模资产纳管 补强平台能⼒ 专业服务⽀持 • 纳 管 资 产 数 量 超 过 数万台; • ⽤户数量⼤,链接负 载⾼; • 拥有⼤量的授权规则 和策略。 • JumpServer 是 IT 资 产⽇常运维主⼊⼝; • 现有平台存在安全隐 患,稳定性需提升; • 互联⽹业务⼤规模、 分布式运营需要多云 资产纳管等功能。 • <1 周 版本升级 过万 台资产 ⽆缝过渡 迁 移 过 程 快 速 平 稳,超过 10,000 台 的 IT 资产安全、完 整迁移⾄新平台。 ⼤规模资产迁移 JumpServer 既有 的授权规则和使⽤ 部⻔的应⽤体验⽆ 缝迁移⾄新平台。 管理体验平滑过渡 客户收益 THANK YOU www.fit2cloud.com 400-052-0755 北京 · 上海 · 深圳0 码力 | 49 页 | 14.87 MB | 1 年前3 JumpServer ⼴受欢迎的开源堡垒机开源社区针对早期版 本的⽀持严重滞后。 版本升级 超⼤规模资产纳管 补强平台能⼒ 专业服务⽀持 • 纳 管 资 产 数 量 超 过 数万台; • ⽤户数量⼤,链接负 载⾼; • 拥有⼤量的授权规则 和策略。 • JumpServer 是 IT 资 产⽇常运维主⼊⼝; • 现有平台存在安全隐 患,稳定性需提升; • 互联⽹业务⼤规模、 分布式运营需要多云 资产纳管等功能。 • <1 周 版本升级 过万 台资产 ⽆缝过渡 迁 移 过 程 快 速 平 稳,超过 10,000 台 的 IT 资产安全、完 整迁移⾄新平台。 ⼤规模资产迁移 JumpServer 既有 的授权规则和使⽤ 部⻔的应⽤体验⽆ 缝迁移⾄新平台。 管理体验平滑过渡 客户收益 THANK YOU www.fit2cloud.com 400-052-0755 北京 · 上海 · 深圳0 码力 | 49 页 | 14.87 MB | 1 年前3
 云原生 DevOps 平台 Zadig 产品介绍队由国内外云计算、DevOps、⼯程运筹学领域专家组成,已连续完 成由盈动和经纬领投的天使轮/PreA 轮融资。公司旗舰产品云原⽣ DevOps 平台 Zadig 正成为软件研发的新标配,软件交付领域的规则 制定者,开启了软件交付 3.0 时代。 02 产品介绍 公司⾃主研发的旗舰产品 Zadig 在 GitHub 上核⼼开源,⽤平台⼯程 ⽀撑软件研发全⽣命周期,让产研⾼效协同,稳定迭代。Zadig0 码力 | 8 页 | 18.50 MB | 1 年前3 云原生 DevOps 平台 Zadig 产品介绍队由国内外云计算、DevOps、⼯程运筹学领域专家组成,已连续完 成由盈动和经纬领投的天使轮/PreA 轮融资。公司旗舰产品云原⽣ DevOps 平台 Zadig 正成为软件研发的新标配,软件交付领域的规则 制定者,开启了软件交付 3.0 时代。 02 产品介绍 公司⾃主研发的旗舰产品 Zadig 在 GitHub 上核⼼开源,⽤平台⼯程 ⽀撑软件研发全⽣命周期,让产研⾼效协同,稳定迭代。Zadig0 码力 | 8 页 | 18.50 MB | 1 年前3
共 12 条
- 1
- 2














