高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践云+社区技术沙龙 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; • 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 • 放缩功能; 人工标注:提供正负样本的标注工具; 样本管理:提供检索,图示,编辑,删除,导入等功能; 模型管理:提供模型训练,预测功能。 腾讯 Metis 智能监控的功能特性(http://github.com/Tencent/Metis) 腾讯 Metis 智能监控的页面 单维时间序列分析 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 异常检测 单指标异常检测,多指标异常检测 根因分析 智能多维下钻分析,链路调用根源分析 告警收敛 事件与事件,事件与时序,时序与时序 日志分析 日志模板提取,日志异常检测,日志聚类分析 腾讯 Metis 智能运维方向 发现问题 分析问题 解决问题 THANKS 关注云加社区公众号0 码力 | 28 页 | 1.88 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云+社区技术沙龙 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 接入服务 基于公有云模式研发 组件框架上云,成为云服务 将原有七大事业群(BG)重组整合,新成立云与智慧产业事业群(CSIG)、平台与内容 事业群(PCG)。在连接人、连接数字内容、连接服务的基础上,更加彰显了腾讯推动由消费 互联网,向产业互联网的升级的决心。 业务上云价值 • 开发效率更高 • 云上特性(VM热迁移等) • 丰富的标准化云服务 • 云原生TKE、研发CICD流程 • 计算资源重用 Kafka Mysql Client CLB 接入服务 业务 服务框架 Redis COS TKE/CVM CKafka CDB CFS DNS:GSLB 灰度到全量的过程 腾讯IDC环境 腾讯云环境 流量逐步迁移 QQ上云历程 --拥抱云原生 华北云 华东云 华南云 华东自研 华北自研 华南自研 香港自研 QQ三地混合云 群/讨论组 SSO接入 鉴权平台0 码力 | 26 页 | 2.39 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission0 码力 | 10 页 | 1.39 MB | 1 年前3
FIT2CLOUD CloudExplorer 产品白皮书 v1.7对于私有云、公有云云磁盘,可申请、挂载、卸载、回收; 对于 VMware 等虚拟化平台下的磁盘,不能脱离虚拟机独立存在,不提供卸载、 回收独立磁盘的功能。 目前支持 OpenStack、阿里云、腾讯云、华为云、AWS、Azure、华为 HCS、华为 HCSOnline 等平台。 2.3.5 云安全组在线申请部署及操作、变更、回收 应用开发测试、运维人员可查看其负责的各个项目下安全组列表以及各个安全组关联的 全组规则,添加删除安全组规则;批量删除安全组; 其中查看查找安全组支持按云平台、云账号、地域、VPC 视图逐级查看查找; 对于 VMware,支持 NSX 防火墙。 目前支持 OpenStack、阿里云、腾讯云、华为云、AWS、Azure、华为 HCS、华为 HCSOnline 等平台。 2.3.6 云负载均衡在线申请部署及操作、变更、回收 应用开发测试、运维人员可查看其负责的各个项目下私有云、公有云负载均衡实例列表, Server 以及配置后端服务器及负载均衡策略。 目前支持阿里云、腾讯云、华为云、AWS、Azure。 2.3.7 云 RDS 在线申请部署及操作、变更、回收 应用开发测试、运维人员可查看其负责的各个项目下公有云 RDS 实例列表,并能够申 请 RDS 实例,指定查询条件查询 RDS 实例,操作、变更、回收 RDS 实例; 目前支持阿里云、腾讯云、华为云、AWS、Azure。 2.3.8 云弹性 IP0 码力 | 60 页 | 0 Bytes | 1 年前3
CloudExplorer 3.0 管理员手册v1.2.........................................................................................32 3.4 纳管腾讯公有云................................................................................................ 部署在云服务提供商数据中心,为市场公众企业客户提供服务被多个企业 客户共享使用的云平台。世界上第一个公有云是亚马逊 AWS。 国外公有云: AWS、Azure。 国内公有云: 阿里云、华为云、腾讯云、UCloud、青云、金山云。 超融合平台 超融合基础架构(Hyper Converged Infrastructure,或简称“HCI”) 是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等 对象存储 是公有云提供的一种新型的存储服务,英文是 Object-based Storage。不 同的云厂商对它有不同的英文缩写命名。例如阿里云把自家的对象存储服 务叫做 OSS,华为云叫 OBS,腾讯云叫 COS。与传统块存储不同的是, 第一,操作对象上是对象(Object),而不是文本文件中文本;第二,存 储方式通过 HTTP 协议上传或下载;第三,在对象存储系统里,不能直接 打开/修改0 码力 | 308 页 | 0 Bytes | 1 年前3
CloudExplorer 3.0 用户手册v1.2部署在云服务提供商数据中心,为市场公众企业客户提供服务被 多个企业客户共享使用的云平台。世界上第一个公有云是亚马逊 AWS。 国外公有云: AWS、Azure。 国内公有云: 阿里云、华为云、腾讯云、UCloud、青云、金 山云。 超融合平台 超融合基础架构(Hyper Converged Infrastructure,或简称 “HCI”)是指在同一套单元设备中不仅仅具备计算、网络、存 对象存储 是公有云提供的一种新型的存储服务,英文是 Object-based Storage。不同的云厂商对它有不同的英文缩写命名。例如阿里 云把自家的对象存储服务叫做 OSS,华为云叫 OBS,腾讯云叫 COS。与传统块存储不同的是,第一,操作对象上是对象 (Object),而不是文本文件中文本;第二,存储方式通过 HTTP 协议上传或下载;第三,在对象存储系统里,不能直接打开/修改 、FusionSphere 杭州飞致云信息科技有限公司 11 支持私有云平台: OpenStack、华为 HCS、华为 HCS Online、青云、阿里小飞天、 腾讯云 TCE 支持公有云平台: 阿里云、腾讯云、华为云、亚马逊 AWS、微软 Azure 支持容器云平台: k8s、OpenShift 支持超融合平台: Nutanix、SmartX 1.5 整体界面说明0 码力 | 102 页 | 0 Bytes | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏CI CD CO 支撑着半个腾讯的技术运营体系——蓝鲸PaaS 腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称IEG)自用的一套用于 构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基 )等模块,帮助企业技术人员快速构建基 础运营PaaS。 腾讯蓝鲸智云秉承开放共赢的理念,以改变中国运维行业为起点,致力于推动国内企业借助研发运营一体化,低成本 实现企业IT经营管理模式升级和自主化。 承载数百款 腾讯业务 管控数十万 台服务器 孵化700+ 应用系统 全球多云 管控 培养数百蓝鲸运 维开发 工具驱动运维:采用运维 开发的模式,实现所有运维任 务自动化、工具化、可视化。 维模型,实现无人值守和智能的运 维与运营。 数据化 2015--2017 智能化 2017—现在 蓝鲸目前在腾讯应用情况及发展方向 4个转型的绊脚石 有重客户端游戏,网页游戏,各类官网,移动终端游戏, 大型游戏平台; 平铺式架构,拓扑关系复杂,模块数量上百,服务器数量 几千…… 腾讯游戏300多款业务中,大多数是由世界各地开发商开发 出来。 所使用的开发语言、开发框架、操作系统、数据库等技术,0 码力 | 26 页 | 8.25 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - ServerlessOps云+社区技术沙龙 Serverless Ops 孔令飞 腾讯云架构师 个人简介 2013 Red Hat: 虚拟化技术 Xen、KVM 的测试 2015 联想云: KVM 研发 2016 加入腾讯:容器平台 (docker + k8s) & 微服务的架构和研发 2019 腾讯云 Serverless 产品架构师 核心诉求 Application Application Architecture Serverless 和 虚拟机 2 种形态下运维能力对比 Serverless vs. IaaS 运维能力对比 Serverless 和 虚拟机 2 种形态下运维能力对比 Serverless 运维案例 腾讯相册微信小程序运维案例 目录 Serverless 介绍 2014 2016 2017 AWS lambda Azure Function GCP Cloud Function IBM Functions ❑ 云计算:去基础架构的过程 ❑ Serverless 符合云计算发展的方向 聚焦业务,快速迭代,提高产品竞争力 Serverless 运行示例 Serverless 介绍 示例:腾讯云 Serverless 平台运行 Function Function Function Fun Fun Fun Fun … … Fun Fun Fun Fun … … Serverless0 码力 | 32 页 | 4.85 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机认证;⽀持单点系统对接(OpenID、OAuth 认证、SAML2 认证);SSO 对接;⽀持扫码登录(企业微信、钉钉和⻜书);(X-Pack) MFA 认证 OTP 认证; RADIUS ⼆次认证;短信认证(阿⾥云、腾讯云、华为云、CMPP v2.0);(X-Pack) 登录复核(X-Pack) ⽤户登录 JumpServer 系统⾏为受管理员的监管与控制; 登录限制 ⽤户登录来源 IP 受管理员控制(⽀持⿊ / Server、PostgreSQL、ClickHouse、DB2;(X-Pack) ⾼清晰度 RDP 连接 ⽀持⾼清晰度 RDP 客户端连接;(X-Pack) 录像云端存储 录像云端存储,⽀持 S3、腾讯云 COS、阿⾥云 OSS、华为云 OBS、Ceph、Swift、Azure; Kubernetes管理 ⽀持对 Kubernetes 进⾏运维审计。 JumpServer 的数据库审计功能 数据库运维安全审计 和加密证书的浏览器 ⽀持宁盾的 RADIUS 双因⼦认证(国密) - 从⼊⼝访问到数据落盘全链路国产化 - 东⽅通 TongHTTP Server 宝兰徳 BES WebServer 腾讯分布式数据库 TDSQL 东⽅通 TongRDS 宝兰徳 BES CacheServer 银河麒麟 V10 统信 UOS V20 中标麒麟 V7.0 优麒麟 Ubuntu0 码力 | 49 页 | 14.87 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台工具额外搭建 全流程能力 专门面向开发者的生产力平台,涵盖全流程需求到 开发,测试,运维的云原生一体化技术底座支撑 云厂商 DevOps 平台 华为云 DevCloud 阿里云效 腾讯 CODING 容器云厂商 云厂商引流为主,锁定风险高 对多云跨地域支持不够 实施负担较重难以推广 面向多云厂商友好,实施迁移成本极低,可扩展性 强,全球多地跨云跨域安全可靠自动化部署 软件工程平台 Zadig 正在成为各行各业领先企业数字化软件研 发的新标配,帮助包括字节、腾讯、阿里、华为、极氪、小鹏、理想、联通、壳牌等 2000 多千家企业实 现产研数字化进化。核心团队由 DevOps 领域云计算工程技术专家和高级工程师为主,骨干技术成员是来 自于谷歌,腾讯,七牛云,阿里。公司已经连续完成来自顶级资本的多轮融资。 自 Zadig 2021 “ ” “0 码力 | 59 页 | 81.43 MB | 1 年前3
共 13 条
- 1
- 2













