 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基 础运营PaaS。 腾讯蓝鲸智云秉承开放共赢的理念,以改变中国运维行业为起点,致力于推动国内企业借助研发运营一体化,低成本 实现企业IT经营管理模式升级和自主化。 2015--2017 智能化 2017—现在 蓝鲸目前在腾讯应用情况及发展方向 4个转型的绊脚石 有重客户端游戏,网页游戏,各类官网,移动终端游戏, 大型游戏平台; 平铺式架构,拓扑关系复杂,模块数量上百,服务器数量 几千…… 腾讯游戏300多款业务中,大多数是由世界各地开发商开发 出来。 所使用的开发语言、开发框架、操作系统、数据库等技术, 是没有直观规律的。 开发商很难为了运维体系而对架构或技术做大规模的修改。 检、电子工单、运营分析、运营 管控、经营管理等。 落地企业工具文化。 回顾一下传统烟囱式模式的弊端 …… 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集0 码力 | 26 页 | 8.25 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基 础运营PaaS。 腾讯蓝鲸智云秉承开放共赢的理念,以改变中国运维行业为起点,致力于推动国内企业借助研发运营一体化,低成本 实现企业IT经营管理模式升级和自主化。 2015--2017 智能化 2017—现在 蓝鲸目前在腾讯应用情况及发展方向 4个转型的绊脚石 有重客户端游戏,网页游戏,各类官网,移动终端游戏, 大型游戏平台; 平铺式架构,拓扑关系复杂,模块数量上百,服务器数量 几千…… 腾讯游戏300多款业务中,大多数是由世界各地开发商开发 出来。 所使用的开发语言、开发框架、操作系统、数据库等技术, 是没有直观规律的。 开发商很难为了运维体系而对架构或技术做大规模的修改。 检、电子工单、运营分析、运营 管控、经营管理等。 落地企业工具文化。 回顾一下传统烟囱式模式的弊端 …… 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集0 码力 | 26 页 | 8.25 MB | 1 年前3
 Red Hat OpenShift GitOps 1.13 基础架构节点上的 GitOps 工作负载control plane 工作负载移到基础架构节点: 4. 可选:在基础架构节点上应用污点并隔离工作负载,并防止其他工作负载调度到这些节点上。 5. 可选: 如果您将污点应用到节点,您可以在 GitOpsService CR 中添加容限: 要验证工作负载是否已调度到 Red Hat OpenShift GitOps 命名空间中的基础架构节点上,请点击任何 pod 名称,并确保已添加了 Node 在 Subscription 资源的 spec.config 字段中添加 nodeSelector 和 tolerations : 订阅 订阅示例 示例 这样可确保 Operator pod 仅调度到基础架构节点上。 这样可确保基础架构节点接受 pod。 输 输出示例 出示例 4. 运行以下命令,验证 GitOps Operator pod 是否在基础架构节点上运行: 输 输出示例 出示例0 码力 | 10 页 | 122.25 KB | 1 年前3 Red Hat OpenShift GitOps 1.13 基础架构节点上的 GitOps 工作负载control plane 工作负载移到基础架构节点: 4. 可选:在基础架构节点上应用污点并隔离工作负载,并防止其他工作负载调度到这些节点上。 5. 可选: 如果您将污点应用到节点,您可以在 GitOpsService CR 中添加容限: 要验证工作负载是否已调度到 Red Hat OpenShift GitOps 命名空间中的基础架构节点上,请点击任何 pod 名称,并确保已添加了 Node 在 Subscription 资源的 spec.config 字段中添加 nodeSelector 和 tolerations : 订阅 订阅示例 示例 这样可确保 Operator pod 仅调度到基础架构节点上。 这样可确保基础架构节点接受 pod。 输 输出示例 出示例 4. 运行以下命令,验证 GitOps Operator pod 是否在基础架构节点上运行: 输 输出示例 出示例0 码力 | 10 页 | 122.25 KB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB DockerImage Docker Hub 跨地域、跨集群部署0 码力 | 26 页 | 2.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB DockerImage Docker Hub 跨地域、跨集群部署0 码力 | 26 页 | 2.39 MB | 1 年前3
 CloudExplorer 3.0 部署运维手册v1.2..............................4 2.1.2 基础模块.......................................................................................................5 2.1.3 扩展模块......................................... ..............................................................6 2.1.4 模块镜像.......................................................................................................6 2.2 组件间关系.......... .........................................................................................16 4.5 扩展模块部署.................................................................................................0 码力 | 29 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 部署运维手册v1.2..............................4 2.1.2 基础模块.......................................................................................................5 2.1.3 扩展模块......................................... ..............................................................6 2.1.4 模块镜像.......................................................................................................6 2.2 组件间关系.......... .........................................................................................16 4.5 扩展模块部署.................................................................................................0 码力 | 29 页 | 0 Bytes | 1 年前3
 FIT2CLOUD CloudExplorer 产品白皮书 v1.7分权分域多角色多门户......................................................................................... 49 3.4 模块化扩展能力.............................................................................................. .......................................................................................52 四、 整体架构及模块功能说明...........................................................................................54 五、 时俱进,保持 服务化和自动化的覆盖。能够: 快速整合支持新采纳的基础架构云平台,架构设计支持以插件符合开放封闭原则进行扩 展支持,只需要开发插件,不需要动 Web 页面层和中间业务逻辑层; 模块化扩展和整合,能够在现有框架下方便扩展支持新的运维工具整合等功能,比如整 合新采纳的运维、安全平台工具,保持服务交付过程的服务化、高效自动化。 杭州飞致云信息科技有限公司 软件用起来才有价值,才有改进的机会0 码力 | 60 页 | 0 Bytes | 1 年前3 FIT2CLOUD CloudExplorer 产品白皮书 v1.7分权分域多角色多门户......................................................................................... 49 3.4 模块化扩展能力.............................................................................................. .......................................................................................52 四、 整体架构及模块功能说明...........................................................................................54 五、 时俱进,保持 服务化和自动化的覆盖。能够: 快速整合支持新采纳的基础架构云平台,架构设计支持以插件符合开放封闭原则进行扩 展支持,只需要开发插件,不需要动 Web 页面层和中间业务逻辑层; 模块化扩展和整合,能够在现有框架下方便扩展支持新的运维工具整合等功能,比如整 合新采纳的运维、安全平台工具,保持服务交付过程的服务化、高效自动化。 杭州飞致云信息科技有限公司 软件用起来才有价值,才有改进的机会0 码力 | 60 页 | 0 Bytes | 1 年前3
 CloudExplorer 3.0 管理员手册v1.2................283 10.3.6 创建管理优化建议报告,并设置自动发送报告到指定邮箱...................284 杭州飞致云信息科技有限公司 6 11 各模块定时任务默认执行时间及配置..............................................................................307 11.1 I”) 是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等 资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据 压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝 横向扩展(scale-out),形成统一的资源池。比较知名常见的超融合平台 有 Nutanix、戴尔的 VxRail,国内的 SmartX、青云超融合。 运维支撑工具平台 指运维工作中帮助运维的各种运维工具平台,如  支持公有云平台: 阿里云、腾讯云、华为云、亚马逊 AWS、微软 Azure  支持容器云平台: k8s、OpenShift  支持超融合平台: Nutanix、SmartX 2 场景模块功能界面说明 2.1 平台定位 云管平台在多云异构基础架构、运维工具环境下,整合多云异构基础架构、运维工具, 给项目生命周期中各角色在开发测试、投产上线、系统运维环节提供一站式的支持,通过0 码力 | 308 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 管理员手册v1.2................283 10.3.6 创建管理优化建议报告,并设置自动发送报告到指定邮箱...................284 杭州飞致云信息科技有限公司 6 11 各模块定时任务默认执行时间及配置..............................................................................307 11.1 I”) 是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等 资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据 压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝 横向扩展(scale-out),形成统一的资源池。比较知名常见的超融合平台 有 Nutanix、戴尔的 VxRail,国内的 SmartX、青云超融合。 运维支撑工具平台 指运维工作中帮助运维的各种运维工具平台,如  支持公有云平台: 阿里云、腾讯云、华为云、亚马逊 AWS、微软 Azure  支持容器云平台: k8s、OpenShift  支持超融合平台: Nutanix、SmartX 2 场景模块功能界面说明 2.1 平台定位 云管平台在多云异构基础架构、运维工具环境下,整合多云异构基础架构、运维工具, 给项目生命周期中各角色在开发测试、投产上线、系统运维环节提供一站式的支持,通过0 码力 | 308 页 | 0 Bytes | 1 年前3
 CloudExplorer 3.0 用户手册v1.2“HCI”)是指在同一套单元设备中不仅仅具备计算、网络、存 储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技 术、重复数据删除、在线数据压缩等元素,而多套单元设备可以 通过网络聚合起来,实现模块化的无缝横向扩展(scale-out), 形成统一的资源池。比较知名常见的超融合平台有 Nutanix、戴 尔的 VxRail,国内的 SmartX、青云超融合。 运维支撑工具平台 指运维工作中帮助运维的各种运维工具平台,如 服务门户整体设计为模块化设计,有多个模块门户组成,包括 Dashboard 门户、虚拟 机服务、负载均衡服务、数据库服务、对象存储服务、账单中心、运营分析、工单中心等模 块。申请和管理资源需要到对应的资源的服务管理门户。  如需申请和管理虚拟机、磁盘、安全组、弹性 IP 资源需要到【虚拟机服务】模块门户。  如需申请和管理公有云负载均衡、F5 负载均衡需要到【负载均衡】模块门户。  如需申请和管理 如需申请和管理 RDS 数据库实例需要到【数据库服务】模块门户。  如需申请和管理对象存储桶、上传管理对象文件需要到【对象存储】模块门户。  如需查看账单支出、资源使用量需要到【账单中心】模块门户。  如需提交工单(人工操作变更部署的)需要到【工单中心】模块门户。 进入各个模块门户有两种方式。  第一种方式 登陆后进入的首个页面是【HOME】页面,如图 1-1 所示。在【HOME】页面,可点0 码力 | 102 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 用户手册v1.2“HCI”)是指在同一套单元设备中不仅仅具备计算、网络、存 储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技 术、重复数据删除、在线数据压缩等元素,而多套单元设备可以 通过网络聚合起来,实现模块化的无缝横向扩展(scale-out), 形成统一的资源池。比较知名常见的超融合平台有 Nutanix、戴 尔的 VxRail,国内的 SmartX、青云超融合。 运维支撑工具平台 指运维工作中帮助运维的各种运维工具平台,如 服务门户整体设计为模块化设计,有多个模块门户组成,包括 Dashboard 门户、虚拟 机服务、负载均衡服务、数据库服务、对象存储服务、账单中心、运营分析、工单中心等模 块。申请和管理资源需要到对应的资源的服务管理门户。  如需申请和管理虚拟机、磁盘、安全组、弹性 IP 资源需要到【虚拟机服务】模块门户。  如需申请和管理公有云负载均衡、F5 负载均衡需要到【负载均衡】模块门户。  如需申请和管理 如需申请和管理 RDS 数据库实例需要到【数据库服务】模块门户。  如需申请和管理对象存储桶、上传管理对象文件需要到【对象存储】模块门户。  如需查看账单支出、资源使用量需要到【账单中心】模块门户。  如需提交工单(人工操作变更部署的)需要到【工单中心】模块门户。 进入各个模块门户有两种方式。  第一种方式 登陆后进入的首个页面是【HOME】页面,如图 1-1 所示。在【HOME】页面,可点0 码力 | 102 页 | 0 Bytes | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission Webhook Node 超卖 HPAPlus HPAPlus • 一个HPA一个goroutine • 支持0 码力 | 10 页 | 1.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission Webhook Node 超卖 HPAPlus HPAPlus • 一个HPA一个goroutine • 支持0 码力 | 10 页 | 1.39 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践基于机器学习的智能运维 发现问题 • 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 • 容量预估分析 解决问题 • 扩容 • 决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析0 码力 | 28 页 | 1.88 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践基于机器学习的智能运维 发现问题 • 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 • 容量预估分析 解决问题 • 扩容 • 决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析0 码力 | 28 页 | 1.88 MB | 1 年前3
 Zadig 面向开发者的云原生 DevOps 平台企 业 合 规 S O P 流 程 , 灰 度 蓝 绿 部 署 策 略 , 完 成 生 产 环 境 发 布 最 后 一 公 里 特色模块(一) – 发布管理 多服务编排升级 配置变更 生产观测 数据变更 灰度发布 流程自动化 特色模块(二) – 客户交付 供应商产品生命周期管理 为客户提供生命周期管理 管理不同渠道的版本 可部署到任何环境 简 化 对 客 户 的 本0 码力 | 59 页 | 81.43 MB | 1 年前3 Zadig 面向开发者的云原生 DevOps 平台企 业 合 规 S O P 流 程 , 灰 度 蓝 绿 部 署 策 略 , 完 成 生 产 环 境 发 布 最 后 一 公 里 特色模块(一) – 发布管理 多服务编排升级 配置变更 生产观测 数据变更 灰度发布 流程自动化 特色模块(二) – 客户交付 供应商产品生命周期管理 为客户提供生命周期管理 管理不同渠道的版本 可部署到任何环境 简 化 对 客 户 的 本0 码力 | 59 页 | 81.43 MB | 1 年前3
共 14 条
- 1
- 2













