 Raft在Curve存储中的工程实践0 码力 | 29 页 | 2.20 MB | 6 月前3 Raft在Curve存储中的工程实践0 码力 | 29 页 | 2.20 MB | 6 月前3
 爱奇艺 CDN 运维平台实践-张强爱奇艺CDN运维平台实践 张强 爱奇艺基础架构部 研发总监 爱奇艺CDN运维平台实践 张强 爱奇艺基础架构部 研发总监 自我介绍 Ø 2009~2014: 在Intel中国研究中心从事移动OS相关开发工作,先后负责过移动OS Package Manager、工具链等模块的设计与研发工作 Ø 2014年加入爱奇艺,主导了CDN数据平台、CDN调度平台、CDN运维平台研发上线, 目前负责CDN相关产品开发和运维工作 目前负责CDN相关产品开发和运维工作 01 爱奇艺CDN概况 02 运维痛点分析 03 运维平台架构设计 04 平台应用&实践 05 总结&展望 目录 01 爱奇艺CDN概况 数据增长趋势 节点分层策略 CDN 节点特点 爱奇艺CDN数据增长趋势 2014 2019 2015 2018 2016 2017 CDN设备量增长8倍 分布区域增长10倍 带宽增长20倍 爱奇艺CDN节点分层 上线,并完成静态 CDN 上千台设备管理和日常配 置管理 2018.09 • Fast 3.0 上线,全新通信机 制,任务实时发布,权限管理 • 可Shell管理任何设备,包括 NAT纯内网设备 04 应用实践&效果 软件配置管理 数据统计架构&开发流程 设备管理应用 平台应用 – 数据统计 应用层(Apps) 服务端 (Server) 处理设备经过Promise集群上报的实时数据,打Tag入0 码力 | 34 页 | 1.75 MB | 1 年前3 爱奇艺 CDN 运维平台实践-张强爱奇艺CDN运维平台实践 张强 爱奇艺基础架构部 研发总监 爱奇艺CDN运维平台实践 张强 爱奇艺基础架构部 研发总监 自我介绍 Ø 2009~2014: 在Intel中国研究中心从事移动OS相关开发工作,先后负责过移动OS Package Manager、工具链等模块的设计与研发工作 Ø 2014年加入爱奇艺,主导了CDN数据平台、CDN调度平台、CDN运维平台研发上线, 目前负责CDN相关产品开发和运维工作 目前负责CDN相关产品开发和运维工作 01 爱奇艺CDN概况 02 运维痛点分析 03 运维平台架构设计 04 平台应用&实践 05 总结&展望 目录 01 爱奇艺CDN概况 数据增长趋势 节点分层策略 CDN 节点特点 爱奇艺CDN数据增长趋势 2014 2019 2015 2018 2016 2017 CDN设备量增长8倍 分布区域增长10倍 带宽增长20倍 爱奇艺CDN节点分层 上线,并完成静态 CDN 上千台设备管理和日常配 置管理 2018.09 • Fast 3.0 上线,全新通信机 制,任务实时发布,权限管理 • 可Shell管理任何设备,包括 NAT纯内网设备 04 应用实践&效果 软件配置管理 数据统计架构&开发流程 设备管理应用 平台应用 – 数据统计 应用层(Apps) 服务端 (Server) 处理设备经过Promise集群上报的实时数据,打Tag入0 码力 | 34 页 | 1.75 MB | 1 年前3
 2.2.2云音乐在GitOps CD领域的最佳实践HorizonCD 云音乐在GitOps CD领域的最佳实践 朱旭 网易云音乐 云原生开发工程师 目 录 背景 01 Horizon模板体系 02 GitOps最佳实践 03 Horizon产品介绍 04 Horizon落地 05 背景 第一部分 背景 云主机时代的痛点 2020年,云音乐开始容器化转型 效率 低下 计算 焦虑 运维 繁琐 成本 高昂 背景 第二部分 ├── Chart.yaml ├── README.md ├── schema ## 定义各种上层用户可理解的输入(支持前端自动渲染) │ ├── application.schema.json ## 应用部署配置的 schema 定义 ├── output │ └── outputs.yaml 运维人员关注特殊场景的人工介入 Horizon模板最佳实践 管理员可以通过快速的配置,将一个复杂 应用的关键配置快速暴露给用户使用,保 障用户进行最佳实践,例如: • 屏蔽复杂的资源配置:业务更容易理解 的标准资源规格 • 底层能力快速封装:混合云、服务网格 有了这样的模板,是否能直接apply使用 呢? GitOps最佳实践 第三部分 ArgoCD的设计 什么是GitOps0 码力 | 22 页 | 3.15 MB | 1 年前3 2.2.2云音乐在GitOps CD领域的最佳实践HorizonCD 云音乐在GitOps CD领域的最佳实践 朱旭 网易云音乐 云原生开发工程师 目 录 背景 01 Horizon模板体系 02 GitOps最佳实践 03 Horizon产品介绍 04 Horizon落地 05 背景 第一部分 背景 云主机时代的痛点 2020年,云音乐开始容器化转型 效率 低下 计算 焦虑 运维 繁琐 成本 高昂 背景 第二部分 ├── Chart.yaml ├── README.md ├── schema ## 定义各种上层用户可理解的输入(支持前端自动渲染) │ ├── application.schema.json ## 应用部署配置的 schema 定义 ├── output │ └── outputs.yaml 运维人员关注特殊场景的人工介入 Horizon模板最佳实践 管理员可以通过快速的配置,将一个复杂 应用的关键配置快速暴露给用户使用,保 障用户进行最佳实践,例如: • 屏蔽复杂的资源配置:业务更容易理解 的标准资源规格 • 底层能力快速封装:混合云、服务网格 有了这样的模板,是否能直接apply使用 呢? GitOps最佳实践 第三部分 ArgoCD的设计 什么是GitOps0 码力 | 22 页 | 3.15 MB | 1 年前3
 B站统⼀监控系统的设计,演进
与实践分享B站统⼀一监控系统的设计,演进 与实践分享 梁梁晓聪 devops @lxcong About Me • 梁梁晓聪 • 2015年年加⼊入B站 • devops • 热爱新技术,热爱开源 • ⼩小宅男 故事的开始 B站炸了了.舆情监控(括弧笑脸) 我们的挑战 • 技术栈多 • 产品模块复杂 • 业务爆发式增⻓长 • 运维要求⾼高 当前情况: • 覆盖率低0 码力 | 34 页 | 650.25 KB | 1 年前3 B站统⼀监控系统的设计,演进
与实践分享B站统⼀一监控系统的设计,演进 与实践分享 梁梁晓聪 devops @lxcong About Me • 梁梁晓聪 • 2015年年加⼊入B站 • devops • 热爱新技术,热爱开源 • ⼩小宅男 故事的开始 B站炸了了.舆情监控(括弧笑脸) 我们的挑战 • 技术栈多 • 产品模块复杂 • 业务爆发式增⻓长 • 运维要求⾼高 当前情况: • 覆盖率低0 码力 | 34 页 | 650.25 KB | 1 年前3
 从十到千,响应团队规模的敏捷与DevOps实践-冯斌从十到千,响应团队规模的敏捷与DevOps实践-冯斌0 码力 | 27 页 | 8.15 MB | 1 年前3 从十到千,响应团队规模的敏捷与DevOps实践-冯斌从十到千,响应团队规模的敏捷与DevOps实践-冯斌0 码力 | 27 页 | 8.15 MB | 1 年前3
 基于 APM 的智能运维体系在京东物流的落地和实践-付正全基于APM的智能运维体系在京东物流的落地和实践 付正全 京东物流 架构师 自我介绍 付正全,京东物流架构师,国家认证信息系统项目管 理师,曾任浪潮集团系统架构师,专注监控平台研发 工作 8 年,研究过市场上数十家厂商的监控平台产品, 对 DevOps 和监控平台有比较深入的了解。目前负责 京东物流火眼监控平台的架构设计和开发工作。 目录 ⚫业界智能运维发展现状及趋势 ⚫智能运维体系建设方法论 ⚫智能运维体系建设方法论 ⚫大规模实时监控平台的实践方案 ⚫智能故障定位与处理实践 ⚫ APM 在京东物流的落地实践 ⚫ 智能运维(AIOps)落地规划 业界智能运维发展趋势 新的问题 运维人数不变,管理机器数翻倍 1 2  3 4 正在消失的运维 运维从业者减少,运维专家匮乏 运维平台日趋复杂,缺乏统一规划 公司内部监控/运维系统繁多,形成数据孤岛 网络拓扑日益复杂,资源云化,虚拟资 JDBC 读缓存 分布式 文件系统 写缓存 存取 应用A 开放平台 API 请求 无线客户端请求 前端网页 请求 应用B 应用C 服务调用 服务调用 应用F 应用G 服务调用 服务调用 应用H 服务调用 服务调用 服务调用 应用A 数据库 JDBC 前端网页 请求 系统问题定位难 快速发展的APM APM (应用性能管理)市场规模逐年递增 0 10 200 码力 | 41 页 | 3.52 MB | 1 年前3 基于 APM 的智能运维体系在京东物流的落地和实践-付正全基于APM的智能运维体系在京东物流的落地和实践 付正全 京东物流 架构师 自我介绍 付正全,京东物流架构师,国家认证信息系统项目管 理师,曾任浪潮集团系统架构师,专注监控平台研发 工作 8 年,研究过市场上数十家厂商的监控平台产品, 对 DevOps 和监控平台有比较深入的了解。目前负责 京东物流火眼监控平台的架构设计和开发工作。 目录 ⚫业界智能运维发展现状及趋势 ⚫智能运维体系建设方法论 ⚫智能运维体系建设方法论 ⚫大规模实时监控平台的实践方案 ⚫智能故障定位与处理实践 ⚫ APM 在京东物流的落地实践 ⚫ 智能运维(AIOps)落地规划 业界智能运维发展趋势 新的问题 运维人数不变,管理机器数翻倍 1 2  3 4 正在消失的运维 运维从业者减少,运维专家匮乏 运维平台日趋复杂,缺乏统一规划 公司内部监控/运维系统繁多,形成数据孤岛 网络拓扑日益复杂,资源云化,虚拟资 JDBC 读缓存 分布式 文件系统 写缓存 存取 应用A 开放平台 API 请求 无线客户端请求 前端网页 请求 应用B 应用C 服务调用 服务调用 应用F 应用G 服务调用 服务调用 应用H 服务调用 服务调用 服务调用 应用A 数据库 JDBC 前端网页 请求 系统问题定位难 快速发展的APM APM (应用性能管理)市场规模逐年递增 0 10 200 码力 | 41 页 | 3.52 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践云+社区技术沙龙 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; • 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 •0 码力 | 28 页 | 1.88 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践云+社区技术沙龙 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; • 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 •0 码力 | 28 页 | 1.88 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云+社区技术沙龙 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) K8S(TKE)+业务画像 K8S(TKE) ⚫ 云原生计算基金会(CNCF),2015年由谷歌牵头成立,第一个毕业的项目Kubernetes。 ⚫ 在云上生长的应用,不0 码力 | 26 页 | 2.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云+社区技术沙龙 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 弹性调度 恢复能力 自动化运维,快速恢复 蓝盾/TencentHub…… 每天可交付数十次 运维开发&应用开发 TSF,Service Mesh K8S(TKE) 云原生方法 业务最佳实践 K8S(TKE) K8S(TKE)+业务画像 K8S(TKE) ⚫ 云原生计算基金会(CNCF),2015年由谷歌牵头成立,第一个毕业的项目Kubernetes。 ⚫ 在云上生长的应用,不0 码力 | 26 页 | 2.39 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏0 码力 | 26 页 | 8.25 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏0 码力 | 26 页 | 8.25 MB | 1 年前3
 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission0 码力 | 10 页 | 1.39 MB | 1 年前3 高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission0 码力 | 10 页 | 1.39 MB | 1 年前3
共 76 条
- 1
- 2
- 3
- 4
- 5
- 6
- 8














 
 