 OpenShift Container Platform 4.10 监控Container Platform 4.10 监控 在 OpenShift Container Platform 中配置和使用监控堆栈 Last Updated: 2023-10-17 OpenShift Container Platform 4.10 监控 在 OpenShift Container Platform 中配置和使用监控堆栈 法律通告 法律通告 Copyright © property of their respective owners. 摘要 摘要 本文提供有关在 OpenShift Container Platform 中配置和使用 Prometheus 监控堆栈的说明。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 章 监 监控概述 控概述 1.1. 关于 OPENSHIFT CONTAINER PLATFORM 监控 1.2. 了解监控堆栈 1.3. OPENSHIFT CONTAINER PLATFORM 监控的常见术语表 1.4. 其他资源 1.5. 后续步骤 第 第 2 章 章 配置 配置监 监控堆 控堆栈 栈 2.1. 先决条件 2.2. 对监控的维护和支持 2.3. 准备配置监控堆栈 20 码力 | 135 页 | 1.58 MB | 1 年前3 OpenShift Container Platform 4.10 监控Container Platform 4.10 监控 在 OpenShift Container Platform 中配置和使用监控堆栈 Last Updated: 2023-10-17 OpenShift Container Platform 4.10 监控 在 OpenShift Container Platform 中配置和使用监控堆栈 法律通告 法律通告 Copyright © property of their respective owners. 摘要 摘要 本文提供有关在 OpenShift Container Platform 中配置和使用 Prometheus 监控堆栈的说明。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 章 监 监控概述 控概述 1.1. 关于 OPENSHIFT CONTAINER PLATFORM 监控 1.2. 了解监控堆栈 1.3. OPENSHIFT CONTAINER PLATFORM 监控的常见术语表 1.4. 其他资源 1.5. 后续步骤 第 第 2 章 章 配置 配置监 监控堆 控堆栈 栈 2.1. 先决条件 2.2. 对监控的维护和支持 2.3. 准备配置监控堆栈 20 码力 | 135 页 | 1.58 MB | 1 年前3
 OpenShift Container Platform 4.14 电源监控OpenShift Container Platform 4.14 电源监控 为 Red Hat OpenShift 配置和使用电源监控 Last Updated: 2024-02-23 OpenShift Container Platform 4.14 电源监控 为 Red Hat OpenShift 配置和使用电源监控 法律通告 法律通告 Copyright © 2024 Red Hat OpenStack community. All other trademarks are the property of their respective owners. 摘要 摘要 您可以使用电源监控来监控 OpenShift Container Platform 集群中运行的每个容器的功耗,如 CPU 和 DRAM。 . . . . . . . . . . . . . . . . . . . . 发行注 行注记 记 1.1. 电源监控 0.1 (技术预览) 第 第 2 章 章 电 电源 源监 监控概述 控概述 2.1. 关于电源监控 2.2. 电源监控架构 2.3. KEPLER 硬件和虚拟化支持 2.4. 其他资源 第 第 3 章 章 为 为 RED HAT OPENSHIFT 安装 安装电 电源 源监 监控 控 3.1. 安装 POWER 监控 OPERATOR 3.2. 部署0 码力 | 20 页 | 350.27 KB | 1 年前3 OpenShift Container Platform 4.14 电源监控OpenShift Container Platform 4.14 电源监控 为 Red Hat OpenShift 配置和使用电源监控 Last Updated: 2024-02-23 OpenShift Container Platform 4.14 电源监控 为 Red Hat OpenShift 配置和使用电源监控 法律通告 法律通告 Copyright © 2024 Red Hat OpenStack community. All other trademarks are the property of their respective owners. 摘要 摘要 您可以使用电源监控来监控 OpenShift Container Platform 集群中运行的每个容器的功耗,如 CPU 和 DRAM。 . . . . . . . . . . . . . . . . . . . . 发行注 行注记 记 1.1. 电源监控 0.1 (技术预览) 第 第 2 章 章 电 电源 源监 监控概述 控概述 2.1. 关于电源监控 2.2. 电源监控架构 2.3. KEPLER 硬件和虚拟化支持 2.4. 其他资源 第 第 3 章 章 为 为 RED HAT OPENSHIFT 安装 安装电 电源 源监 监控 控 3.1. 安装 POWER 监控 OPERATOR 3.2. 部署0 码力 | 20 页 | 350.27 KB | 1 年前3
 监控Apache Flink应用程序(入门)监控Apache Flink应用程序(入门) caolei Exported on 01/10/2020 caolei – 监控Apache Flink应用程序(入门) – 2 Table of Contents 1 Flink指标体系 ...................................................................... ............................................................................................. 6 3 监控 .................................................................................................. ....................................................................................... 9 4 进度和吞吐量监控 ......................................................................................... 10 4.1 吞吐量0 码力 | 23 页 | 148.62 KB | 1 年前3 监控Apache Flink应用程序(入门)监控Apache Flink应用程序(入门) caolei Exported on 01/10/2020 caolei – 监控Apache Flink应用程序(入门) – 2 Table of Contents 1 Flink指标体系 ...................................................................... ............................................................................................. 6 3 监控 .................................................................................................. ....................................................................................... 9 4 进度和吞吐量监控 ......................................................................................... 10 4.1 吞吐量0 码力 | 23 页 | 148.62 KB | 1 年前3
 在Kubernetes上部署高可用的Service Mesh监控在 k8s 上部署高可用的 service mesh 监控 pctang@caicloud.io 唐鹏程 才云科技TOC Solving issues in a new way Monitoring your service mesh Old-school monitoringPrometheus + Kubernetes ● A time series based monitoring0 码力 | 35 页 | 2.98 MB | 6 月前3 在Kubernetes上部署高可用的Service Mesh监控在 k8s 上部署高可用的 service mesh 监控 pctang@caicloud.io 唐鹏程 才云科技TOC Solving issues in a new way Monitoring your service mesh Old-school monitoringPrometheus + Kubernetes ● A time series based monitoring0 码力 | 35 页 | 2.98 MB | 6 月前3
 36-云原生监控体系建设-秦晓辉云原生监控体系建设 秦晓辉 快猫星云 联合创始人 个人介绍 秦晓辉,常用网名龙渊秦五、UlricQin,山东人,12年 毕业自山东大学,10年经验一直是在运维研发相关方向, 是Open-Falcon、Nightingale、Categraf 等开源软件 的核心研发,快猫星云联合创始人,当前在创业,为客 户提供稳定性保障相关的产品 个人主页:https://ulricqin.github.io/ io/ 大纲 • 云原生之后监控需求的变化 • 从Kubernetes架构来看要监控的组件 • Kubernetes所在宿主的监控 • Kubernetes Node组件监控 • Kubernetes控制面组件监控 • Kubernetes资源对象的监控 • Pod内的业务应用的监控 • 业务应用依赖的中间件的监控 云原生之后监控需求的 变化 云原生之后监控需求的变化 •相比物理机虚拟机时 •原来使用资产视角管理监控对象的系统不再适用 •要么使用注册中心来自动发现,要么就是采集器和被监控对象通过sidecar模式捆绑一体 指标生命周期变短 •微服务的流行,要监控的服务数量大幅增长,是之前的指标数量十倍都不止 •广大研发工程师也更加重视可观测能力的建设,更愿意埋点 •各种采集器层出不穷,都是本着可采尽采的原则,一个中间件实例动辄采集几千个指标 指标数量大幅增长 •老一代监控系统更多的是关注机0 码力 | 32 页 | 3.27 MB | 6 月前3 36-云原生监控体系建设-秦晓辉云原生监控体系建设 秦晓辉 快猫星云 联合创始人 个人介绍 秦晓辉,常用网名龙渊秦五、UlricQin,山东人,12年 毕业自山东大学,10年经验一直是在运维研发相关方向, 是Open-Falcon、Nightingale、Categraf 等开源软件 的核心研发,快猫星云联合创始人,当前在创业,为客 户提供稳定性保障相关的产品 个人主页:https://ulricqin.github.io/ io/ 大纲 • 云原生之后监控需求的变化 • 从Kubernetes架构来看要监控的组件 • Kubernetes所在宿主的监控 • Kubernetes Node组件监控 • Kubernetes控制面组件监控 • Kubernetes资源对象的监控 • Pod内的业务应用的监控 • 业务应用依赖的中间件的监控 云原生之后监控需求的 变化 云原生之后监控需求的变化 •相比物理机虚拟机时 •原来使用资产视角管理监控对象的系统不再适用 •要么使用注册中心来自动发现,要么就是采集器和被监控对象通过sidecar模式捆绑一体 指标生命周期变短 •微服务的流行,要监控的服务数量大幅增长,是之前的指标数量十倍都不止 •广大研发工程师也更加重视可观测能力的建设,更愿意埋点 •各种采集器层出不穷,都是本着可采尽采的原则,一个中间件实例动辄采集几千个指标 指标数量大幅增长 •老一代监控系统更多的是关注机0 码力 | 32 页 | 3.27 MB | 6 月前3
 探讨和实践基于Istio的微服务治理事件监控探讨和实践基于Istio的微服务治理事件监控 2018.11.25 徐运元关于我 2008年毕业于浙江大学,曾在思科和浙大网新有超过 9年的工作经验和5年的云计算领域工作经验,带领团 队完成公司第一代基于Kubernetes的云平台开发和第 二代基于Kubernetes的DevOps云平台开发。目前致力 于公司基于Istio的微服务平台打造。 来自于浙江大学SEL实验室目录 CONTENTS 微服务平台的监控演进 Mixer组件的功能介绍 Mixer组件的功能介绍 基于Mixer的开发流程和实例微服务平台的监控演进典型的运维场景 传统的监控面临容器化和微服务化的困境 测试运维沟通鸿沟,如何提升沟通效率 监控工具繁杂,如何快速找到合适工具进行问题定位 偶发性问题场景复杂,如何保留发生现场 如何在错综复杂的未服用调用链路中找到错误源头监控场景转换 帮助运维人员快速的定位问题,解决问题 基于容器化和微服务化的监 控场景 • 基于请求的依赖追踪监控 基于虚拟化的监控场景 • 应用规模大 • 服务之间依赖呈现为线型 • 日志、性能指标需要集中化 存储 基于主机的监控场景 • 应用规模较小 • 服务之间没有互相依赖 • 日志、性能指标都在单个主 机问题一:什么是用户想要的监控 什么是用户想要的监控?分布式监控的三个维度 Metrics Logging Tracing 指标监控 • 指标可被聚合0 码力 | 29 页 | 8.37 MB | 6 月前3 探讨和实践基于Istio的微服务治理事件监控探讨和实践基于Istio的微服务治理事件监控 2018.11.25 徐运元关于我 2008年毕业于浙江大学,曾在思科和浙大网新有超过 9年的工作经验和5年的云计算领域工作经验,带领团 队完成公司第一代基于Kubernetes的云平台开发和第 二代基于Kubernetes的DevOps云平台开发。目前致力 于公司基于Istio的微服务平台打造。 来自于浙江大学SEL实验室目录 CONTENTS 微服务平台的监控演进 Mixer组件的功能介绍 Mixer组件的功能介绍 基于Mixer的开发流程和实例微服务平台的监控演进典型的运维场景 传统的监控面临容器化和微服务化的困境 测试运维沟通鸿沟,如何提升沟通效率 监控工具繁杂,如何快速找到合适工具进行问题定位 偶发性问题场景复杂,如何保留发生现场 如何在错综复杂的未服用调用链路中找到错误源头监控场景转换 帮助运维人员快速的定位问题,解决问题 基于容器化和微服务化的监 控场景 • 基于请求的依赖追踪监控 基于虚拟化的监控场景 • 应用规模大 • 服务之间依赖呈现为线型 • 日志、性能指标需要集中化 存储 基于主机的监控场景 • 应用规模较小 • 服务之间没有互相依赖 • 日志、性能指标都在单个主 机问题一:什么是用户想要的监控 什么是用户想要的监控?分布式监控的三个维度 Metrics Logging Tracing 指标监控 • 指标可被聚合0 码力 | 29 页 | 8.37 MB | 6 月前3
 24-云原生中间件之道-高磊支持PB级数据存储 高并发: 千亿数据实时分析 数据源 设备监控 传感器 轨迹数据 车联网 业务集群 物联网套件写入 云原生 DB 轨迹查 询|实时 监测 MR 云原 生DB 统计 分析 物联网数据存储和查询 将车联网数据、设备监控数据、客流分析管控数据、交通数据、传感器数据实时 写入HBase中,分析结果输出到用户的监控前端系统展示,实现物联网数据的实时 监控分析。 优势 易接入: 轻松对接消息系统、流计算系统 需求表现在: • 云盘挂载、卸载效率提高:可以灵活的将块设备在不同节点进行快速的挂载切换; • 存储设备问题自愈能力增强:提供存储服务的问题自动修复能力,减少人为干预; • 提供更加灵活的卷大小配置能力。 2. 监控能力需求 • 多数存储服务在底层文件系统级别已经提供了监控能力,然后从云原生数据卷角度的监控能力仍需要加强,目前提供的PV监控数据维度较 少、监控力度较低; 具体需求: 具体需求: • 提供更细力度(目录)的监控能力; • 提供更多维度的监控指标:读写时延、读写频率、IO 分布等指标; 3. 性能要求 • 在大数据计算场景同时大量应用访问存储的需求很高,这样对存储服务带来的性能需求成为应用运行效率的关键瓶颈 具体需求: • 底层存储服务提供更加优异的存储性能服务,优化 CPFS、GPFS 等高性能存储服务满足业务需求; • 容器编排层面:优化存储调度能力,0 码力 | 22 页 | 4.39 MB | 6 月前3 24-云原生中间件之道-高磊支持PB级数据存储 高并发: 千亿数据实时分析 数据源 设备监控 传感器 轨迹数据 车联网 业务集群 物联网套件写入 云原生 DB 轨迹查 询|实时 监测 MR 云原 生DB 统计 分析 物联网数据存储和查询 将车联网数据、设备监控数据、客流分析管控数据、交通数据、传感器数据实时 写入HBase中,分析结果输出到用户的监控前端系统展示,实现物联网数据的实时 监控分析。 优势 易接入: 轻松对接消息系统、流计算系统 需求表现在: • 云盘挂载、卸载效率提高:可以灵活的将块设备在不同节点进行快速的挂载切换; • 存储设备问题自愈能力增强:提供存储服务的问题自动修复能力,减少人为干预; • 提供更加灵活的卷大小配置能力。 2. 监控能力需求 • 多数存储服务在底层文件系统级别已经提供了监控能力,然后从云原生数据卷角度的监控能力仍需要加强,目前提供的PV监控数据维度较 少、监控力度较低; 具体需求: 具体需求: • 提供更细力度(目录)的监控能力; • 提供更多维度的监控指标:读写时延、读写频率、IO 分布等指标; 3. 性能要求 • 在大数据计算场景同时大量应用访问存储的需求很高,这样对存储服务带来的性能需求成为应用运行效率的关键瓶颈 具体需求: • 底层存储服务提供更加优异的存储性能服务,优化 CPFS、GPFS 等高性能存储服务满足业务需求; • 容器编排层面:优化存储调度能力,0 码力 | 22 页 | 4.39 MB | 6 月前3
 中国移动磐舟DevSecOps平台云原生安全实践全功能云IDE开发 每个云IDE都是一个云端小笔记本,一人一 本,多人可形成云端小局域网。可独立编 写调试代码,可团队协作。 安全代码仓库托管 统一的安全代码仓库,按项目级别分级管 理,落盘加密,云IDE防护,显示水印等多 重防护。 云原生虚拟化开发集群 利用虚拟化技术实现开发集群,分钟级交 付,突破有限资源开发集群供给。 原生使用模式,开发组件一键部署 云原生CI持续集成 CODE DEPLOY OPERATE MONITOR RELEASE TEST BUILD DEV BUILD TIME OPS RUN TIME 上线即安全(安全左移)+ 自适应安全(持续监控&响应) SEC 安全需求 业务需求进来以后从五个维度对业务需求进行安全分析 威胁分析模型 威胁资源库 安全需求基线 威胁情报库 病例库 安全开发-安全需求分析 安全需求分析通过将安全策 l 能力输出:针对自有安全能力可以 增值输出政企客户 安全管控-镜像扫描 在自动、增量、批量进行镜像上线前的扫描后,生产节点拉取安全镜像,运行后提供服务,但漏洞问题日新月异,有很多迭代 速度慢的业务应用随着时间的推移,一些新的漏洞也需及时发现整改。镜像扫描工具会自动、周期性对已上线业务应用的镜像进行 多维度深度扫描,及时发现新出现的安全问题,及时修正。 业务 容器 业务 容器 业务0 码力 | 22 页 | 5.47 MB | 1 年前3 中国移动磐舟DevSecOps平台云原生安全实践全功能云IDE开发 每个云IDE都是一个云端小笔记本,一人一 本,多人可形成云端小局域网。可独立编 写调试代码,可团队协作。 安全代码仓库托管 统一的安全代码仓库,按项目级别分级管 理,落盘加密,云IDE防护,显示水印等多 重防护。 云原生虚拟化开发集群 利用虚拟化技术实现开发集群,分钟级交 付,突破有限资源开发集群供给。 原生使用模式,开发组件一键部署 云原生CI持续集成 CODE DEPLOY OPERATE MONITOR RELEASE TEST BUILD DEV BUILD TIME OPS RUN TIME 上线即安全(安全左移)+ 自适应安全(持续监控&响应) SEC 安全需求 业务需求进来以后从五个维度对业务需求进行安全分析 威胁分析模型 威胁资源库 安全需求基线 威胁情报库 病例库 安全开发-安全需求分析 安全需求分析通过将安全策 l 能力输出:针对自有安全能力可以 增值输出政企客户 安全管控-镜像扫描 在自动、增量、批量进行镜像上线前的扫描后,生产节点拉取安全镜像,运行后提供服务,但漏洞问题日新月异,有很多迭代 速度慢的业务应用随着时间的推移,一些新的漏洞也需及时发现整改。镜像扫描工具会自动、周期性对已上线业务应用的镜像进行 多维度深度扫描,及时发现新出现的安全问题,及时修正。 业务 容器 业务 容器 业务0 码力 | 22 页 | 5.47 MB | 1 年前3
 OpenShift Container Platform 4.7 日志记录Elasticsearch 节点磁盘高水位线 已达到 Elasticsearch 节点磁盘的洪水水位线 当 Elasticsearch 节点预计在未来 6 小时内将到达磁 磁盘 盘低水位 低水位线 线、磁 磁盘 盘高水位 高水位线 线或磁 磁盘 盘洪水 洪水 Stage 水位 水位线 线阈值时,警报会应用过去几个警告。这个警告周期为您提供了在节点达到磁盘水位线阈值 前响应的时间。警告消息也提供故障排除步骤 Elasticsearch 代 理中提供命令行选项来控制字段中的 HTTP 超时。(BZ#1908707) 在以前的版本中,在一些情况下,OpenShift Container Platform 监控仪表板中没有 Red Hat OpenShift Logging/Elasticsearch 仪表板,因为仪表板配置资源指向不同的命名空间所有者,并 导致 OpenShift Container Platform on this namespace。 这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须 设置这个选项,以确保集群监控提取 openshift-operators-redhat 命名空间。 f. 选择 stable-5.x 作为 更新 更新频 频道 道。 g. 选择一个批准策略 批准策略。 Automatic0 码力 | 183 页 | 1.98 MB | 1 年前3 OpenShift Container Platform 4.7 日志记录Elasticsearch 节点磁盘高水位线 已达到 Elasticsearch 节点磁盘的洪水水位线 当 Elasticsearch 节点预计在未来 6 小时内将到达磁 磁盘 盘低水位 低水位线 线、磁 磁盘 盘高水位 高水位线 线或磁 磁盘 盘洪水 洪水 Stage 水位 水位线 线阈值时,警报会应用过去几个警告。这个警告周期为您提供了在节点达到磁盘水位线阈值 前响应的时间。警告消息也提供故障排除步骤 Elasticsearch 代 理中提供命令行选项来控制字段中的 HTTP 超时。(BZ#1908707) 在以前的版本中,在一些情况下,OpenShift Container Platform 监控仪表板中没有 Red Hat OpenShift Logging/Elasticsearch 仪表板,因为仪表板配置资源指向不同的命名空间所有者,并 导致 OpenShift Container Platform on this namespace。 这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须 设置这个选项,以确保集群监控提取 openshift-operators-redhat 命名空间。 f. 选择 stable-5.x 作为 更新 更新频 频道 道。 g. 选择一个批准策略 批准策略。 Automatic0 码力 | 183 页 | 1.98 MB | 1 年前3
 OpenShift Container Platform 4.10 可伸缩性和性能推荐的 ETCD 实践 1.6. 将 ETCD 移动到不同的磁盘 1.7. 分离 ETCD 数据 1.8. OPENSHIFT CONTAINER PLATFORM 基础架构组件 1.9. 移动监控解决方案 1.10. 移动默认 REGISTRY 1.11. 移动路由器 1.12. 基础架构节点大小 1.13. 其他资源 第 第 2 章 章 IBM Z 和 和 LINUXONE 环 环境的推荐主机 . . . . . . . . . 第 第 7 章 章 扩 扩展 展 CLUSTER MONITORING OPERATOR 7.1. PROMETHEUS 数据库存储要求 7.2. 配置集群监控 第 第 8 章 章 根据 根据对 对象限制 象限制规 规划您的 划您的环 环境 境 8.1. OPENSHIFT CONTAINER PLATFORM 为主发行版本测试了集群最大值 8.2. 测试集群最大值的 的系统实际上会运行 20 个容器。 注意 注意 云供应商的磁盘 IOPS 节流可能会对 CRI-O 和 kubelet 产生影响。当节点上运行大量 I/O 高负载的 pod 时,可能会出现超载的问题。建议您监控节点上的磁盘 I/O,并使用有足够 吞吐量的卷。 podsPerCore 根据节点中的处理器内核数来设置节点可运行的 pod 数量。例如:在一个有 4 个处理器内 核的节点上将 podsPerCore0 码力 | 315 页 | 3.19 MB | 1 年前3 OpenShift Container Platform 4.10 可伸缩性和性能推荐的 ETCD 实践 1.6. 将 ETCD 移动到不同的磁盘 1.7. 分离 ETCD 数据 1.8. OPENSHIFT CONTAINER PLATFORM 基础架构组件 1.9. 移动监控解决方案 1.10. 移动默认 REGISTRY 1.11. 移动路由器 1.12. 基础架构节点大小 1.13. 其他资源 第 第 2 章 章 IBM Z 和 和 LINUXONE 环 环境的推荐主机 . . . . . . . . . 第 第 7 章 章 扩 扩展 展 CLUSTER MONITORING OPERATOR 7.1. PROMETHEUS 数据库存储要求 7.2. 配置集群监控 第 第 8 章 章 根据 根据对 对象限制 象限制规 规划您的 划您的环 环境 境 8.1. OPENSHIFT CONTAINER PLATFORM 为主发行版本测试了集群最大值 8.2. 测试集群最大值的 的系统实际上会运行 20 个容器。 注意 注意 云供应商的磁盘 IOPS 节流可能会对 CRI-O 和 kubelet 产生影响。当节点上运行大量 I/O 高负载的 pod 时,可能会出现超载的问题。建议您监控节点上的磁盘 I/O,并使用有足够 吞吐量的卷。 podsPerCore 根据节点中的处理器内核数来设置节点可运行的 pod 数量。例如:在一个有 4 个处理器内 核的节点上将 podsPerCore0 码力 | 315 页 | 3.19 MB | 1 年前3
共 203 条
- 1
- 2
- 3
- 4
- 5
- 6
- 21














 
 