 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏检、电子工单、运营分析、运营 管控、经营管理等。 落地企业工具文化。 回顾一下传统烟囱式模式的弊端 …… 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集 视图 自助 发布 临时 活动 流程 系统 老板 视图 配置 刷新 周报 邮件 业务 门户 ...... 十年发展 2008-2012 • 烟囱自动化 2012-2015 • 调度自动化 • 运维PaaS 2015-2017 • 数据运维 • 运维运营PaaS 2017-2019 • DevOps • AIOps • 研发运维运营一体化 01 蓝鲸技术运营PaaS体系 企业IT对象:服务器、存储、网络、虚拟化、私有云、公有云、混合云、超融合、容器、业务应用、基础服务 运维自动化 数据中心自 动化 应用运维自 动化 业务运维自 动化 CMP 跨系统编排 与调度 运行监控和故障管理 第三方监控接入 基础监控 采集 存储 检测 告警 故障自愈 蓝鲸平台 管控平台 PaaS平台:开发框架/API集成 统一配置管理 模型定义 自动采集 配置维护0 码力 | 26 页 | 8.25 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏检、电子工单、运营分析、运营 管控、经营管理等。 落地企业工具文化。 回顾一下传统烟囱式模式的弊端 …… 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集 视图 自助 发布 临时 活动 流程 系统 老板 视图 配置 刷新 周报 邮件 业务 门户 ...... 十年发展 2008-2012 • 烟囱自动化 2012-2015 • 调度自动化 • 运维PaaS 2015-2017 • 数据运维 • 运维运营PaaS 2017-2019 • DevOps • AIOps • 研发运维运营一体化 01 蓝鲸技术运营PaaS体系 企业IT对象:服务器、存储、网络、虚拟化、私有云、公有云、混合云、超融合、容器、业务应用、基础服务 运维自动化 数据中心自 动化 应用运维自 动化 业务运维自 动化 CMP 跨系统编排 与调度 运行监控和故障管理 第三方监控接入 基础监控 采集 存储 检测 告警 故障自愈 蓝鲸平台 管控平台 PaaS平台:开发框架/API集成 统一配置管理 模型定义 自动采集 配置维护0 码力 | 26 页 | 8.25 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission Webhook Node 超卖 HPAPlus HPAPlus • 一个HPA一个goroutine • • HPA对象级别抑制时间 • requests 和 limits 两种资源计算方式 • CronHPA • HPA对象Enable 和 Disable • 动态调整 minRepliacs VPAPlus • 动态调整Container Cgroup • requets 和 limit 比例设置 • Resource Range设置 • CheckPoint对象timeout时间0 码力 | 10 页 | 1.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission Webhook Node 超卖 HPAPlus HPAPlus • 一个HPA一个goroutine • • HPA对象级别抑制时间 • requests 和 limits 两种资源计算方式 • CronHPA • HPA对象Enable 和 Disable • 动态调整 minRepliacs VPAPlus • 动态调整Container Cgroup • requets 和 limit 比例设置 • Resource Range设置 • CheckPoint对象timeout时间0 码力 | 10 页 | 1.39 MB | 1 年前3
 Red Hat OpenShift GitOps 1.13 基础架构节点上的 GitOps 工作负载control plane 工作负载移到基础架构节点: 4. 可选:在基础架构节点上应用污点并隔离工作负载,并防止其他工作负载调度到这些节点上。 5. 可选: 如果您将污点应用到节点,您可以在 GitOpsService CR 中添加容限: 要验证工作负载是否已调度到 Red Hat OpenShift GitOps 命名空间中的基础架构节点上,请点击任何 pod 名称,并确保已添加了 Node 在 Subscription 资源的 spec.config 字段中添加 nodeSelector 和 tolerations : 订阅 订阅示例 示例 这样可确保 Operator pod 仅调度到基础架构节点上。 这样可确保基础架构节点接受 pod。 输 输出示例 出示例 4. 运行以下命令,验证 GitOps Operator pod 是否在基础架构节点上运行: 输 输出示例 出示例0 码力 | 10 页 | 122.25 KB | 1 年前3 Red Hat OpenShift GitOps 1.13 基础架构节点上的 GitOps 工作负载control plane 工作负载移到基础架构节点: 4. 可选:在基础架构节点上应用污点并隔离工作负载,并防止其他工作负载调度到这些节点上。 5. 可选: 如果您将污点应用到节点,您可以在 GitOpsService CR 中添加容限: 要验证工作负载是否已调度到 Red Hat OpenShift GitOps 命名空间中的基础架构节点上,请点击任何 pod 名称,并确保已添加了 Node 在 Subscription 资源的 spec.config 字段中添加 nodeSelector 和 tolerations : 订阅 订阅示例 示例 这样可确保 Operator pod 仅调度到基础架构节点上。 这样可确保基础架构节点接受 pod。 输 输出示例 出示例 4. 运行以下命令,验证 GitOps Operator pod 是否在基础架构节点上运行: 输 输出示例 出示例0 码力 | 10 页 | 122.25 KB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB DockerImage Docker Hub 跨地域、跨集群部署0 码力 | 26 页 | 2.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB DockerImage Docker Hub 跨地域、跨集群部署0 码力 | 26 页 | 2.39 MB | 1 年前3
 CloudExplorer 3.0 管理员手册v1.2hcso_conf.json 配置文件,用来覆盖插件内 部自定义兼容的 endpoint 地址,插件会优先获取 json 配置文件 endpoint 地址,如果未 获取到配置文件才会通过云账号认证地址动态拼接 endpoint,模板文件附件下载: hcso_conf.json,文件格式如图 3-34 所示。 杭州飞致云信息科技有限公司 57 图 3-34 模版文件 hcso_conf.json 在用户名和密码之外再额外增加一层安全保护。 启用 MFA 后,用户登录云管网站时,系统将要求输入用户名和密码(第一安全要素), 然后要求输入来自其 MFA 设备的动态验证码(第二安全要素),双因素的安全认证将为 账户提供更高的安全保护。MFA 动态码可通过以下应用绑定和生成,在手机应用商店可 搜索:  FreeOTP  Google Authenticator  宁盾令牌 杭州飞致云信息科技有限公司 杭州飞致云信息科技有限公司 78 MFA 开启后,在登录页面与未开启时一样,先输入用户名、密码,如图 4-22 所示, 点击【登录】按钮后,门户将显示要求输入 MFA 动态码【一次性验证码】,输入后点击 【登录】按钮后方可登录。 图 4-22 MFA 开启-登录页面 图 4-23 MFA 开启-一次性验证码 OPT 二次认证配置步骤如下。 (1) 开启全局 MFA 验证,开启后所有用户登录时都要验证0 码力 | 308 页 | 0 Bytes | 1 年前3 CloudExplorer 3.0 管理员手册v1.2hcso_conf.json 配置文件,用来覆盖插件内 部自定义兼容的 endpoint 地址,插件会优先获取 json 配置文件 endpoint 地址,如果未 获取到配置文件才会通过云账号认证地址动态拼接 endpoint,模板文件附件下载: hcso_conf.json,文件格式如图 3-34 所示。 杭州飞致云信息科技有限公司 57 图 3-34 模版文件 hcso_conf.json 在用户名和密码之外再额外增加一层安全保护。 启用 MFA 后,用户登录云管网站时,系统将要求输入用户名和密码(第一安全要素), 然后要求输入来自其 MFA 设备的动态验证码(第二安全要素),双因素的安全认证将为 账户提供更高的安全保护。MFA 动态码可通过以下应用绑定和生成,在手机应用商店可 搜索:  FreeOTP  Google Authenticator  宁盾令牌 杭州飞致云信息科技有限公司 杭州飞致云信息科技有限公司 78 MFA 开启后,在登录页面与未开启时一样,先输入用户名、密码,如图 4-22 所示, 点击【登录】按钮后,门户将显示要求输入 MFA 动态码【一次性验证码】,输入后点击 【登录】按钮后方可登录。 图 4-22 MFA 开启-登录页面 图 4-23 MFA 开启-一次性验证码 OPT 二次认证配置步骤如下。 (1) 开启全局 MFA 验证,开启后所有用户登录时都要验证0 码力 | 308 页 | 0 Bytes | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践基于机器学习的智能运维 发现问题 • 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 • 容量预估分析 解决问题 • 扩容 • 决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析0 码力 | 28 页 | 1.88 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践基于机器学习的智能运维 发现问题 • 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 • 容量预估分析 解决问题 • 扩容 • 决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析0 码力 | 28 页 | 1.88 MB | 1 年前3
 Zadig 面向开发者的云原生 DevOps 平台+ Gerrit + Zadig + 内部发布平台 技术栈: Go +git ( yml ) + 多集群 K8s 分支策略: 单分支 master 开发 环境策略: 4 套同构环境动态分配 测试管理: 500 API+E2E cases 字节跳动 - 飞书场景二: Gerrit + Zadig 方案 工程师体验 现状 Zadig Helm 方案 管理员 1. 上线服务,每个环境都配置0 码力 | 59 页 | 81.43 MB | 1 年前3 Zadig 面向开发者的云原生 DevOps 平台+ Gerrit + Zadig + 内部发布平台 技术栈: Go +git ( yml ) + 多集群 K8s 分支策略: 单分支 master 开发 环境策略: 4 套同构环境动态分配 测试管理: 500 API+E2E cases 字节跳动 - 飞书场景二: Gerrit + Zadig 方案 工程师体验 现状 Zadig Helm 方案 管理员 1. 上线服务,每个环境都配置0 码力 | 59 页 | 81.43 MB | 1 年前3
 Zadig 面向开发者的云原生 DevOps 平台工具链: 飞书 + Gerrit + Zadig + 内部发布平台 技术栈: Go +git(yml)+多集群 K8s 分支策略: 单分支 master 开发 环境策略: 4 套同构环境动态分配 测试管理: 500 API+E2E cases 字节跳动 - 飞书场景二: Gerrit + Zadig 方案 工程师体验 现状 Zadig Helm 方案 管理员 1. 上线服务,每个环境都配置一份服务0 码力 | 59 页 | 23.57 MB | 1 年前3 Zadig 面向开发者的云原生 DevOps 平台工具链: 飞书 + Gerrit + Zadig + 内部发布平台 技术栈: Go +git(yml)+多集群 K8s 分支策略: 单分支 master 开发 环境策略: 4 套同构环境动态分配 测试管理: 500 API+E2E cases 字节跳动 - 飞书场景二: Gerrit + Zadig 方案 工程师体验 现状 Zadig Helm 方案 管理员 1. 上线服务,每个环境都配置一份服务0 码力 | 59 页 | 23.57 MB | 1 年前3
共 8 条
- 1













