高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践云+社区技术沙龙 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; • 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 • 智能运维系统 智能运维系统:机器学习+业务运维,2017年8月-至今 SPEAKER 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 智能运维(AIOps) 基于机器学习的智能运维 发现问题 • 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 关联事件分析 • 容量预估分析 解决问题 • 扩容 • 决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 单维时间序列分析0 码力 | 28 页 | 1.88 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - ServerlessOps0 码力 | 32 页 | 4.85 MB | 1 年前3
基于 APM 的智能运维体系在京东物流的落地和实践-付正全基于APM的智能运维体系在京东物流的落地和实践 付正全 京东物流 架构师 自我介绍 付正全,京东物流架构师,国家认证信息系统项目管 理师,曾任浪潮集团系统架构师,专注监控平台研发 工作 8 年,研究过市场上数十家厂商的监控平台产品, 对 DevOps 和监控平台有比较深入的了解。目前负责 京东物流火眼监控平台的架构设计和开发工作。 目录 ⚫业界智能运维发展现状及趋势 ⚫智能运维体系建设方法论 ⚫智能运维体系建设方法论 ⚫大规模实时监控平台的实践方案 ⚫智能故障定位与处理实践 ⚫ APM 在京东物流的落地实践 ⚫ 智能运维(AIOps)落地规划 业界智能运维发展趋势 新的问题 运维人数不变,管理机器数翻倍 1 2 3 4 正在消失的运维 运维从业者减少,运维专家匮乏 运维平台日趋复杂,缺乏统一规划 公司内部监控/运维系统繁多,形成数据孤岛 网络拓扑日益复杂,资源云化,虚拟资 新运维时代来临 目录 ⚫业界智能运维发展现状及趋势分析 ⚫智能运维体系建设方法论 ⚫大规模实时监控平台的实践方案 ⚫智能故障定位与处理实践 ⚫ APM 在京东物流的落地实践 ⚫智能运维(AIOps)落地规划 智能运维体系建设方法论 ◼统一规划、避免重复建设 ◼标准化是前提 ◼产品化设计、产品化开发 ◼服务驱动 ◼运维中台 ◼业务增值 ◼过程改进 智能运维体系建设方法论 ◼闭环0 码力 | 41 页 | 3.52 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云+社区技术沙龙 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 接入服务0 码力 | 26 页 | 2.39 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏数据驱动运维:基于大数据 的接入、存储、分析技术,对运 维数据进行全面挖掘和分析,实 现数据驱动自动化运维。 机器驱动运维:基于智能算法 的机器自我学习,训练机器智能运 维模型,实现无人值守和智能的运 维与运营。 数据化 2015--2017 智能化 2017—现在 蓝鲸目前在腾讯应用情况及发展方向 4个转型的绊脚石 有重客户端游戏,网页游戏,各类官网,移动终端游戏, 大型游戏平台; 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集 数据存储 监控曲线 展示 智能告警 监控系统 Jenkins 版本仓库 报表编辑器 BI引擎 版本管理 配置存取 告警策略 管理 发送短信 数据存储 版本 视图 自助 发布 临时 活动 流程 系统 老板 视图 可视化大屏、统一报表、统一权限、移动运维 变更 流程融合 事件 问题 请求 知识库 SLA 服务目录 流程引擎 运维流程管理 配置 平台 容器平台 作业 平台 视图 嘉为蓝鲸CO:数据分析与智能运营解决方案 中 间 服 务 层 数据总线(数据交换、同步、共享) 计 算 引 擎 数据 采集 Beats 采集框架 存 储 MySQL ES Redis TSDB TiDB HDFS0 码力 | 26 页 | 8.25 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践0 码力 | 10 页 | 1.39 MB | 1 年前3
openEuler 21.09 技术白皮书内存回收算法:在发生 OOM 时,优先对 低优先级的进程组进行内存回收,保障在线业 务的正常运行。 支持 PAC(Pointer Authentication Code)特性: 在使用寄存器的值作为指针访问数据或代码之前验 证其内容,抵御 ROP/JOP 攻击。 支持 BTI (Branch Target Identifiers) 特性: 对间接跳转的目标进行限制。与 PA 结合使用 减少控制流攻击。 新介质数据读写性能,但在元数据管理方面,基于现有 journal 同步机制,元数据 管理开销大,且容易出现写放大问题,NVDIMM 优势无法充分发挥。 EulerFS 创新元数据软更新技术(Soft Update),基于指针的目录双视图计数机制,减少元数据同步开销,有效提升文件 系统 create、unlink、mkdir、rmdir 系统调用性能,较 ext4/dax,元数据操作延时降低 1~4 倍,带宽高 20%~4 破不同数据结构之间的界限,使得内存管理更加地简单 与灵活。 3. 采用软更新技术,简化了实现复杂度:软更新 (Soft Update) 是一种轻量级的保证文件系统一致性的技术。 4. 基于指针的目录双视图计数机制,减少元数据同步开销,有效提升文件系统读写性能。 5. 依赖跟踪:目录项的新建、删除等操作并不是立刻持久化的,在进行相应的操作后,只是在 inode 中跟踪依赖的 持久化操0 码力 | 35 页 | 3.72 MB | 1 年前3
Ubuntu 桌面培训 2010渐减小,制造商开始期望软件能够带 来额外的收入。越来越多的厂商开始单独销售软件,也不再提供软件的源代码。 1983年春天,Richard Matthew Stallman,这位曾经在 MIT 人工智能实验室工作 的程序员,发起了 GNU 项目,旨在开发一个自由的类 Unix 的操作系统。他为专有 软件的增长和随之而来的用户不再能够修改他们电脑上的程序而忧心忡忡。软件开 发者被束缚,有悖自由精神的现象随之普遍发生。GNU Internet Mail Extensions, S/MIME)安全邮件的支持。 • 扩展扩展是能够帮助您满足特定需求的强大工具。 Mozilla Thunderbird 拥有多 项特性,例如快速搜索、智能地址簿、高级消息过滤等。 • 新闻阅读器 Mozilla Thunderbird 使添加您喜爱的新闻组更加容易,并且可选择 只下载消息头或者下载完整消息;另外,还提供了离线支持。 96 即时通信 的自动更正功能可以自动纠正常见的拼写错误和输入 错误,从而使您的输入工作变得更加轻松。此外,自动更正功能还可以帮助您自动 应用正确的文档格式,并在识别出文字的特殊用法时自动插入特定的特殊字符 • 智能断字:当一个位于句尾的单词因为过长而不得不转入下一行的时候,智能断字 功能可以自动在句尾加入连字符号以保持单词的连贯性。该功能会自动搜索整个文 档并做出加入连字符号的建议,您可以自主决定是否需要加入连字符号。 • 邮件合并:邮件0 码力 | 524 页 | 57.54 MB | 1 年前3
Ubuntu 桌面培训 2010渐减小,制造商开始期望软件能够带 来额外的收入。越来越多的厂商开始单独销售软件,也不再提供软件的源代码。 1983年春天,Richard Matthew Stallman,这位曾经在 MIT 人工智能实验室工作 的程序员,发起了 GNU 项目,旨在开发一个自由的类 Unix 的操作系统。他为专有 软件的增长和随之而来的用户不再能够修改他们电脑上的程序而忧心忡忡。软件开 发者被束缚,有悖自由精神的现象随之普遍发生。GNU Internet Mail Extensions, S/MIME)安全邮件的支持。 • 扩展扩展是能够帮助您满足特定需求的强大工具。 Mozilla Thunderbird 拥有多 项特性,例如快速搜索、智能地址簿、高级消息过滤等。 使用互联网 95 Ubuntu 桌面培训 目录 • 新闻阅读器 Mozilla Thunderbird 使添加您喜爱的新闻组更加容易,并且可选择 只下载消息头或者下载完整消息;另外,还提供了离线支持。 的自动更正功能可以自动纠正常见的拼写错误和输入 错误,从而使您的输入工作变得更加轻松。此外,自动更正功能还可以帮助您自动 应用正确的文档格式,并在识别出文字的特殊用法时自动插入特定的特殊字符 • 智能断字:当一个位于句尾的单词因为过长而不得不转入下一行的时候,智能断字 功能可以自动在句尾加入连字符号以保持单词的连贯性。该功能会自动搜索整个文 档并做出加入连字符号的建议,您可以自主决定是否需要加入连字符号。 • 邮件合并:邮件0 码力 | 540 页 | 26.26 MB | 1 年前3
openEuler 22.03-LTS 技术白皮书边云协同框架,具备边云应用 统一管理和发放等基础能力,并将通过增强智能协同提升 AI 易用性和场景适应性,增强服务协同实现跨边云服务发现和流 量转发,以及增强数据协同提升南向服务能力。 功能描述 行业应用(服务)/ 应用技能 Sedna (Cloud) Global- Manager Local- Controller Local- Controller 智能协同 管理协同 边缘南向服务 服务协同 、媒体流的按需持久化,并具备数据分析和数据导出的能力。 4. 边云智能协同架构(Sedna):基于开源 Sedna 框架,提供基础的边云协同推理、联邦学习、增量学习等能力,并 实现了基础的模型管理、数据集管理等,使能开发者快速开发边云 AI 协同特性,以及提升用户边云 AI 特性的训练 与部署效率。 应用场景 可应用智能制造、城市交通、高速收费稽查、智慧加油站、医疗影像识别、智慧园区等广泛的边云协同场景。 IEC61508、EC62443 等。 应用场景 嵌入式系统可广泛应用于航空航天、工业控制、电信设备、汽车及医疗等领域;随着 5G、AI 新型技术的成熟,还可应用 于物联网 IoT 设备,边缘智能计算设备等。 软总线 设备上线/连接/通信 统一运行时 容器 混合关键性系统(mixed criticality system) 嵌入式硬件支持 Linux 软实时 qemu Raspberry0 码力 | 17 页 | 6.52 MB | 1 年前3
共 61 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7













