 Zabbix高级应用 -- K8S 集群监控Zabbix高级应用 --K8s集群监控 ����� ��������FiberHome 演讲主题: • CactiFans • Zabbix • Microservice • K8s • Golang https://blog.cactifans.com/ 无边界监控 应用架构发展趋势 数据采集 RESTful 接口 LLD – 低级别发现 低级发现提供了一种监控主机上变化实体,并 对采集器采集的原始数据通过管道进行处理,最终达到 数据展现和存储的要求。 例如 SNMP采集交换机内存 15MB string? 图形?触发器? Kubernetes 架构 k8s node k8s pod k8s master 应用 Zabbix Agent HTTP Agent CPU/内存/磁盘/网络 服务/日志/... 状态/CPU/内存 Kubernetes 监控 Kubernetes0 码力 | 25 页 | 11.98 MB | 1 年前3 Zabbix高级应用 -- K8S 集群监控Zabbix高级应用 --K8s集群监控 ����� ��������FiberHome 演讲主题: • CactiFans • Zabbix • Microservice • K8s • Golang https://blog.cactifans.com/ 无边界监控 应用架构发展趋势 数据采集 RESTful 接口 LLD – 低级别发现 低级发现提供了一种监控主机上变化实体,并 对采集器采集的原始数据通过管道进行处理,最终达到 数据展现和存储的要求。 例如 SNMP采集交换机内存 15MB string? 图形?触发器? Kubernetes 架构 k8s node k8s pod k8s master 应用 Zabbix Agent HTTP Agent CPU/内存/磁盘/网络 服务/日志/... 状态/CPU/内存 Kubernetes 监控 Kubernetes0 码力 | 25 页 | 11.98 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission limits 两种资源计算方式 • CronHPA • HPA对象Enable 和 Disable • 动态调整 minRepliacs VPAPlus • 动态调整Container Cgroup • requets 和 limit 比例设置 • Resource Range设置 • CheckPoint对象timeout时间 • Pod对象更新时间 ` • 资源合法性校验 THANKS0 码力 | 10 页 | 1.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission limits 两种资源计算方式 • CronHPA • HPA对象Enable 和 Disable • 动态调整 minRepliacs VPAPlus • 动态调整Container Cgroup • requets 和 limit 比例设置 • Resource Range设置 • CheckPoint对象timeout时间 • Pod对象更新时间 ` • 资源合法性校验 THANKS0 码力 | 10 页 | 1.39 MB | 1 年前3
 Scaling a Multi-Tenant k8s Cluster in a TelcoScaling a Multi-Tenant k8s Cluster in a Telco Pablo Moncada October 28, 2020 About MasMovil group ● 4th telecom company in Spain ● Provides voice and broadband services to +12M customers ● Several0 码力 | 6 页 | 640.05 KB | 1 年前3 Scaling a Multi-Tenant k8s Cluster in a TelcoScaling a Multi-Tenant k8s Cluster in a Telco Pablo Moncada October 28, 2020 About MasMovil group ● 4th telecom company in Spain ● Provides voice and broadband services to +12M customers ● Several0 码力 | 6 页 | 640.05 KB | 1 年前3
 Uber 核心派单系统及其集群管理演化-李宁Traffic Controller Health Controller Host B Service B Service C RPC Muttley ⼿手动发送1%流量量到新集群 服务健康检查,⾃自动流量量切换 部署管理理 •逐步部署 •Staging •Shadow •Canary •⾃自动部署 •⾃自动触发+⼈人⼯工审核 •根据监控⾃自动回滚 变更更管理理0 码力 | 23 页 | 15.26 MB | 1 年前3 Uber 核心派单系统及其集群管理演化-李宁Traffic Controller Health Controller Host B Service B Service C RPC Muttley ⼿手动发送1%流量量到新集群 服务健康检查,⾃自动流量量切换 部署管理理 •逐步部署 •Staging •Shadow •Canary •⾃自动部署 •⾃自动触发+⼈人⼯工审核 •根据监控⾃自动回滚 变更更管理理0 码力 | 23 页 | 15.26 MB | 1 年前3
 openEuler 22.03-LTS 技术白皮书时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本,聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 openEuler 作为一个操作系统发行版平台,每两年推出一个 LTS 版本。该版本为企业级用户提供了一个安全稳定可靠 的操作系统。 openEuler KubeOS:云原生场景,实现 OS 容器化部署、运维,提供与业务容器一致的基于 K8s 的管理体验。 • 安全容器方案:iSulad+shimv2+StratoVirt 安全容器方案,相比传统 Docker+Qemu 方案,底噪和启动时间优化 40%。 • 双平面部署工具 eggo:ARM/x86 双平面混合集群 OS 高效一键式安装,百节点部署时间 <15min。 新场景 • 边缘计算:发布面向边缘计算场景的版本 (Cloud) Global- Manager Local- Controller Local- Controller 智能协同 管理协同 边缘南向服务 服务协同 数据协同 网络协同 K8s OS Core 通信 Kit 容器引擎 KubeEdge (Cloud) EdgeMesh Agent KubeEdge (Edge) Sedna (Edge) CloudCore0 码力 | 17 页 | 6.52 MB | 1 年前3 openEuler 22.03-LTS 技术白皮书时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本,聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 openEuler 作为一个操作系统发行版平台,每两年推出一个 LTS 版本。该版本为企业级用户提供了一个安全稳定可靠 的操作系统。 openEuler KubeOS:云原生场景,实现 OS 容器化部署、运维,提供与业务容器一致的基于 K8s 的管理体验。 • 安全容器方案:iSulad+shimv2+StratoVirt 安全容器方案,相比传统 Docker+Qemu 方案,底噪和启动时间优化 40%。 • 双平面部署工具 eggo:ARM/x86 双平面混合集群 OS 高效一键式安装,百节点部署时间 <15min。 新场景 • 边缘计算:发布面向边缘计算场景的版本 (Cloud) Global- Manager Local- Controller Local- Controller 智能协同 管理协同 边缘南向服务 服务协同 数据协同 网络协同 K8s OS Core 通信 Kit 容器引擎 KubeEdge (Cloud) EdgeMesh Agent KubeEdge (Edge) Sedna (Edge) CloudCore0 码力 | 17 页 | 6.52 MB | 1 年前3
 openEuler 23.09 技术白皮书同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本,聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 年 9 月 30 日,发布 openEuler 22.09 创新版本,持续补齐全场景的支持。 2022 年 12 月 30 日,发布 openEuler 的影响。 • 混部多优先级:允许 cgroup 配置 -2~2 的 cpu.qos_level,即多个优先级,使用 qos_level_weight 设置不同优先级权 重,按照 CPU 的使用比例进行资源的划分。并提供唤醒抢占能力。在提高机器利用率的同时,保证高优和延迟敏感的 在线业务不受离线业务的影响。 • 可编程调度:基于 eBPF 的可编程调度框架,支持内核调度器动态扩展调度策略,以满足不同负载的性能需求,具备 子系统提供对系统中一组进程打开的文件数量(即句柄数)进行分组管理,相比于已 有的 rlimit 方法,能更好的实现文件句柄数的资源控制(资源申请及释放、资源使用动态调整、实现分组控制等), 并为资源管理提供方便调用的接口,实现避免某个进程打开过多文件造成整个系统资源不足无法正常工作。 • cgroupv1 使能 cgroup writeback:cgroup writeback 用于控制和管0 码力 | 52 页 | 5.25 MB | 1 年前3 openEuler 23.09 技术白皮书同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本,聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 年 9 月 30 日,发布 openEuler 22.09 创新版本,持续补齐全场景的支持。 2022 年 12 月 30 日,发布 openEuler 的影响。 • 混部多优先级:允许 cgroup 配置 -2~2 的 cpu.qos_level,即多个优先级,使用 qos_level_weight 设置不同优先级权 重,按照 CPU 的使用比例进行资源的划分。并提供唤醒抢占能力。在提高机器利用率的同时,保证高优和延迟敏感的 在线业务不受离线业务的影响。 • 可编程调度:基于 eBPF 的可编程调度框架,支持内核调度器动态扩展调度策略,以满足不同负载的性能需求,具备 子系统提供对系统中一组进程打开的文件数量(即句柄数)进行分组管理,相比于已 有的 rlimit 方法,能更好的实现文件句柄数的资源控制(资源申请及释放、资源使用动态调整、实现分组控制等), 并为资源管理提供方便调用的接口,实现避免某个进程打开过多文件造成整个系统资源不足无法正常工作。 • cgroupv1 使能 cgroup writeback:cgroup writeback 用于控制和管0 码力 | 52 页 | 5.25 MB | 1 年前3
 openEuler 21.09 技术白皮书KubeOS:云原生场景,实现 OS 容器化部署、运维,提供与业务容器一致的基于 K8S 的管理体验。 • 安全容器方案:iSulad + shimv2 + StratoVirt 安全容器方案,相比传统 docker + qemu 方案,底噪和启动时间 优化 40%。 • 双平面部署工具 eggo:ARM/X86 双平面混合集群 OS 高效一键式安装,百节点部署时间 <15min。 探索场景创新 处理,提升网络性能。可用于 DDOS 防御、防火墙、 网络 QOS 等场景。 SVA (Shared Virtual Addressing) 支持: 进程虚拟地址在主机进程和设备间共享,实 现资源跨主机与设备免拷贝复用,提升跨主 机和设备业务通讯性能。 openEuler 21.09 技术白皮书 11 新介质文件系统 非易失性内存(NVDIMM,比如 Intel Optane)是一种 05/ 云化基座 openEuler 21.09 技术白皮书 14 云原生调度增强 在云业务场景中,交互类延时敏感在线业务存在潮汐现象,CPU 资源利用率普遍较低 (~15%),在线和离线业务混合部署 是提升资源利用率的有效方式。在现有的内核资源分配和管理机制,混部后的在线业务的性能抖动大,服务质量无法的到有效 保障。openEuler 面向云原生业务混部场景,创新 CPU 调度算法和内存回收算法,支撑提升系统的0 码力 | 35 页 | 3.72 MB | 1 年前3 openEuler 21.09 技术白皮书KubeOS:云原生场景,实现 OS 容器化部署、运维,提供与业务容器一致的基于 K8S 的管理体验。 • 安全容器方案:iSulad + shimv2 + StratoVirt 安全容器方案,相比传统 docker + qemu 方案,底噪和启动时间 优化 40%。 • 双平面部署工具 eggo:ARM/X86 双平面混合集群 OS 高效一键式安装,百节点部署时间 <15min。 探索场景创新 处理,提升网络性能。可用于 DDOS 防御、防火墙、 网络 QOS 等场景。 SVA (Shared Virtual Addressing) 支持: 进程虚拟地址在主机进程和设备间共享,实 现资源跨主机与设备免拷贝复用,提升跨主 机和设备业务通讯性能。 openEuler 21.09 技术白皮书 11 新介质文件系统 非易失性内存(NVDIMM,比如 Intel Optane)是一种 05/ 云化基座 openEuler 21.09 技术白皮书 14 云原生调度增强 在云业务场景中,交互类延时敏感在线业务存在潮汐现象,CPU 资源利用率普遍较低 (~15%),在线和离线业务混合部署 是提升资源利用率的有效方式。在现有的内核资源分配和管理机制,混部后的在线业务的性能抖动大,服务质量无法的到有效 保障。openEuler 面向云原生业务混部场景,创新 CPU 调度算法和内存回收算法,支撑提升系统的0 码力 | 35 页 | 3.72 MB | 1 年前3
 Zadig 面向开发者的云原生 DevOps 平台企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 2022 年 9 月 场 景 深 化 能 力 增 强 Helm/K8s YAML/ 托管场景接入流程优化 UX/UI 升级,工程师一线体验优化 推出效能看板,实时客观度量工程数据指标 效 率 优 化 、 开 发 者 体 验 增 强 2023 年 面向生态伙伴开放场景 项目间依赖复杂,环境管理难 • 交付版本依赖工单,发布风险高 • 公共资源 / 业务资源利用率低 赋能多业务:一个平台解决了多异构项目的管理和规范 团队高效协作:定义团队角色工作流模板,随时可用云上环境 价值清晰呈现:为管理者提供全视角效能数据,赋能数字决策 人工低效操作减少 80% 构建资源利用率提升 60% 业务资源利用率提升 30% 统一治理内部规范,开发 自助上线;解放运维,工 面向多服务并行部署,安全发布, 0 维护负担 支撑云原生构建 / 运行环境,多云异构支持及企业 级登录权限支持 传统运维管理类平台 蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集 面向开发者,需结合 CI/CD 工具额外搭建 全流程能力 专门面向开发者的生产力平台,涵盖全流程需求到 开发,测试,运维的云原生一体化技术底座支撑 云厂商 DevOps 平台0 码力 | 59 页 | 81.43 MB | 1 年前3 Zadig 面向开发者的云原生 DevOps 平台企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 2022 年 9 月 场 景 深 化 能 力 增 强 Helm/K8s YAML/ 托管场景接入流程优化 UX/UI 升级,工程师一线体验优化 推出效能看板,实时客观度量工程数据指标 效 率 优 化 、 开 发 者 体 验 增 强 2023 年 面向生态伙伴开放场景 项目间依赖复杂,环境管理难 • 交付版本依赖工单,发布风险高 • 公共资源 / 业务资源利用率低 赋能多业务:一个平台解决了多异构项目的管理和规范 团队高效协作:定义团队角色工作流模板,随时可用云上环境 价值清晰呈现:为管理者提供全视角效能数据,赋能数字决策 人工低效操作减少 80% 构建资源利用率提升 60% 业务资源利用率提升 30% 统一治理内部规范,开发 自助上线;解放运维,工 面向多服务并行部署,安全发布, 0 维护负担 支撑云原生构建 / 运行环境,多云异构支持及企业 级登录权限支持 传统运维管理类平台 蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集 面向开发者,需结合 CI/CD 工具额外搭建 全流程能力 专门面向开发者的生产力平台,涵盖全流程需求到 开发,测试,运维的云原生一体化技术底座支撑 云厂商 DevOps 平台0 码力 | 59 页 | 81.43 MB | 1 年前3
 Zadig 面向开发者的云原生 DevOps 平台Zadig 企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 2022年9月 场 景 深 化 能 力 增 强 Helm/K8s YAML/托管场景接入流程优化 UX/UI 升级,工程师一线体验优化 推出效能看板,实时客观度量工程数据指标 效 率 优 化 、 开 发 者 体 验 增 强 2023年 面向生态伙伴开放场景 项目间依赖复杂,环境管理难 • 交付版本依赖工单,发布风险高 • 公共资源/业务资源利用率低 赋能多业务:一个平台解决了多异构项目的管理和规范 团队高效协作:定义团队角色工作流模板,随时可用云上环境 价值清晰呈现:为管理者提供全视角效能数据,赋能数字决策 人工低效操作减少 80% 构建资源利用率提升 60% 业务资源利用率提升 30% 统一治理内部规范,开发 自助上线;解放运维,工 作重心向业务稳定性保障, 面向多服务并行部署,安全发布,0 维护负担 支撑云原生构建/运行环境,多云异构支持及企业 级登录权限支持 传统运维管理类平台 蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集 面向开发者,需结合 CI/CD 工具额外搭建 全流程能力 专门面向开发者的生产力平台,涵盖全流程需求到 开发,测试,运维的云原生一体化技术底座支撑 云厂商 DevOps 平台0 码力 | 59 页 | 23.57 MB | 1 年前3 Zadig 面向开发者的云原生 DevOps 平台Zadig 企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 2022年9月 场 景 深 化 能 力 增 强 Helm/K8s YAML/托管场景接入流程优化 UX/UI 升级,工程师一线体验优化 推出效能看板,实时客观度量工程数据指标 效 率 优 化 、 开 发 者 体 验 增 强 2023年 面向生态伙伴开放场景 项目间依赖复杂,环境管理难 • 交付版本依赖工单,发布风险高 • 公共资源/业务资源利用率低 赋能多业务:一个平台解决了多异构项目的管理和规范 团队高效协作:定义团队角色工作流模板,随时可用云上环境 价值清晰呈现:为管理者提供全视角效能数据,赋能数字决策 人工低效操作减少 80% 构建资源利用率提升 60% 业务资源利用率提升 30% 统一治理内部规范,开发 自助上线;解放运维,工 作重心向业务稳定性保障, 面向多服务并行部署,安全发布,0 维护负担 支撑云原生构建/运行环境,多云异构支持及企业 级登录权限支持 传统运维管理类平台 蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集 面向开发者,需结合 CI/CD 工具额外搭建 全流程能力 专门面向开发者的生产力平台,涵盖全流程需求到 开发,测试,运维的云原生一体化技术底座支撑 云厂商 DevOps 平台0 码力 | 59 页 | 23.57 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践互联网,向产业互联网的升级的决心。 业务上云价值 • 开发效率更高 • 云上特性(VM热迁移等) • 丰富的标准化云服务 • 云原生TKE、研发CICD流程 • 计算资源重用 • 公共组件产品化 • 丰富的公有云海外资源 • 使用业界标准化的云原生服 务,离开封闭的开发环境和组 件 • 工程师输出优秀的组件到云上 成为标准服务,孵化成更好的 云服务 • 服务开源生态 • 为行业输出公有云迁移经验 客户 业务价值 工程师价值 客户价值 如何上云? --提升上云效率,降低迁移风险 业务上云策略 CLB 接入服务 业务 服务框架 Redis/CKV COS Docker/K8S/TKE CKafka CDB/Mysql IEG PCG WXG CDG CISG TEG ⚫公有云专线与自研互通 ⚫使用公有云服务 ⚫改造较大的搬迁组件上云 ⚫使用云原生PaaS ⚫边上云边改造 接入服务、逻辑服务、数据存储、文件存储 混合云过度到全量公有云 服务调用质量、用户访问质量、 服务可用率 数据上公有云 • 冷迁移+增量 •同步中心数据同步 •切换过程停写 私有组件迁移上云 • 云上部署服务集群 •自行维护和迭代 •同步中心或主备 •业务切路由切换服务 兼容公有云 • DTS自助热迁移 •增量完成后切换读写 •VIP或DNS寻址 数据库搬迁上云方式 接入层与应用层切换上云0 码力 | 26 页 | 2.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践互联网,向产业互联网的升级的决心。 业务上云价值 • 开发效率更高 • 云上特性(VM热迁移等) • 丰富的标准化云服务 • 云原生TKE、研发CICD流程 • 计算资源重用 • 公共组件产品化 • 丰富的公有云海外资源 • 使用业界标准化的云原生服 务,离开封闭的开发环境和组 件 • 工程师输出优秀的组件到云上 成为标准服务,孵化成更好的 云服务 • 服务开源生态 • 为行业输出公有云迁移经验 客户 业务价值 工程师价值 客户价值 如何上云? --提升上云效率,降低迁移风险 业务上云策略 CLB 接入服务 业务 服务框架 Redis/CKV COS Docker/K8S/TKE CKafka CDB/Mysql IEG PCG WXG CDG CISG TEG ⚫公有云专线与自研互通 ⚫使用公有云服务 ⚫改造较大的搬迁组件上云 ⚫使用云原生PaaS ⚫边上云边改造 接入服务、逻辑服务、数据存储、文件存储 混合云过度到全量公有云 服务调用质量、用户访问质量、 服务可用率 数据上公有云 • 冷迁移+增量 •同步中心数据同步 •切换过程停写 私有组件迁移上云 • 云上部署服务集群 •自行维护和迭代 •同步中心或主备 •业务切路由切换服务 兼容公有云 • DTS自助热迁移 •增量完成后切换读写 •VIP或DNS寻址 数据库搬迁上云方式 接入层与应用层切换上云0 码力 | 26 页 | 2.39 MB | 1 年前3
共 128 条
- 1
- 2
- 3
- 4
- 5
- 6
- 13














