探讨和实践基于Istio的微服务治理事件监控基于容器化和微服务化的监 控场景 • 应用规模巨大 • 服务之间依赖呈现为网状 • 除了日志、性能指标,需要 基于请求的依赖追踪监控 基于虚拟化的监控场景 • 应用规模大 • 服务之间依赖呈现为线型 • 日志、性能指标需要集中化 存储 基于主机的监控场景 • 应用规模较小 • 服务之间没有互相依赖 • 日志、性能指标都在单个主 机问题一:什么是用户想要的监控 什么是用户想要的监控?分布式监控的三个维度0 码力 | 29 页 | 8.37 MB | 6 月前3
MySQL 兼容性可以做到什么程度Canal/CloudCanal • Maxwell • Debezium • Streamsets • mysql-binlog-connector-java • Flink CDC 性能指标 • 25w rps • 8GB 大事务 • 5s 延迟* 下一步 • 验证更多工具 • GTID • 多流业务系统 上游 Single Source of Truth 问题背景 备库的能力 • 支持 PolarDB-X 之间数据同步 • 支持 DDL 同步 • 支持事务复制、行级复制 已验证工具或系统 • MySQL/MariaDB • PolarDB-X 性能指标 • 1.5w rps • 1s 延迟* 下一步 • 多流 • GTID事务并行复制 • 更多源端完全兼容 MySQL 吗 03 History doesn't repeat itself0 码力 | 18 页 | 3.02 MB | 6 月前3
25-云原生应用可观测性实践-向阳reserved. 混合云全栈可观测架构 〔分布式〕 流量分析 解析 聚合 关联 压缩 零侵入的流量采集与分析 发送 零侵入的云原生应用可观测性 Flow 数据节点 云原生,水平扩展 监控数据 性能指标 调用日志 网络链路 由业务代码驱动的可观测性数据、云API数据 调用关系 知识图谱 链路追踪 黄金指标 关联 应用链路(Tracing) 应用日志(Logging) 应用链路 TraceID reserved. 混合云全栈可观测架构 〔分布式〕 流量分析 解析 聚合 关联 压缩 零侵入的流量采集与分析 发送 零侵入的云原生应用可观测性 Flow 数据节点 云原生,水平扩展 监控数据 性能指标 调用日志 网络链路 由业务代码驱动的可观测性数据、云API数据 调用关系 知识图谱 链路追踪 黄金指标 关联 应用链路(Tracing) 应用日志(Logging) 应用链路 TraceID0 码力 | 39 页 | 8.44 MB | 6 月前3
Nacos架构&原理
个服务进行注册,随后随机订阅 5 个服务池中的服务;共 10w 个客户端,10w 个服务,50w 服务实例,观察注册过程中的服务端性能指标及推送 SLA。 注册完成后放置,达到稳定状态后再观察服务端性能指标,整个过程持续 20min。 之后所有施压机关闭,观察集群注销的服务端性能指标。 2. 大规模服务注册达到稳定状态后,部分实例频繁发布 场景描述 再次运行上述测试场景,当注册服务达到稳定状态后,0 码力 | 326 页 | 12.83 MB | 9 月前3
阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践(运维打通) • 装机模板、OS版本、内核版本多;内核补丁、参数不同;其他如网卡中断打散 • 稳定性要求高 • 性能、宕机、夯机、抖动系统架构 • 基础监控 • 秒级、分钟级监控 • 内核性能指标采集 • 监控大盘 • 在线率 • 宕机率 • 抖动率 • 基线系统 • 基础环境一致性故障自愈 (1-5-10) • 监控、故障发现 (1-5) • 本地检测 (walle, NPD)0 码力 | 21 页 | 7.81 MB | 6 月前3
蚂蚁金服网络代理演进之路Push消息慢 海外消息慢 收发图片慢 建连时长 建连成功率 链路稳定性 链路一致性 RPC错误率 Push实时性 海外RTT 数据效率 快 速 稳 定 高 效 移动客户痛点 性能指标 线下支付 大促 国际支付咻一咻与敬业福咻一咻的挑战 亿级用户快速进入 亿级用户同时点击 剩余红包实时显示无线移动网络优化 § 统一通道:主长连接 + 短连接 § 统一协议:MTLS+MMTP0 码力 | 46 页 | 19.93 MB | 6 月前3
TiDB v8.4 中文手册恢复集群快照数据备份,速度可以达到单 TiKV 存储节点 100 MiB/s,恢复速度具有可扩展性。更详细说明 请参考恢复性能和影响。 • 恢复日志备份数据,速度可以达到 30 GiB/h。更详细说明请参考PITR 的性能指标。 760 8.4.1.4 备份存储 TiDB 支持将数据备份到 Amazon S3、Google Cloud Storage (GCS)、Azure Blob Storage、NFS,或者实现 FULL_BACKUP_TS 之前的快照备份数据。 aws s3 rm --recursive s3://backup-101/snapshot-${date} 8.4.3.3.4 PITR 的性能指标 • PITR 恢复速度,平均到单台 TiKV 节点:全量恢复 (Full Restore) 为 280 GB/h,日志恢复(Restore Meta Files 和 Restore KV Files)为 对外提供服务。 基于备份恢复的容灾方案,目前,RPO 低于 5 分钟,而 RTO 则取决于需要恢复的集群数据大小,对于 v6.5.0 版 本的 BR,其恢复速度可以参考快照恢复的性能与影响和PITR 的性能指标。通常来说,大部分客户会把跨区域 的备份作为数据安全的最后一道防线,是大多数系统都需要的。对于该方案的详细信息,请参考基于备份与 恢复的容灾方案。 另外,从 v6.5.0 开始,BR 支持基于 AWS0 码力 | 5072 页 | 104.05 MB | 10 月前3
TiDB v8.2 中文手册恢复集群快照数据备份,速度可以达到单 TiKV 存储节点 100 MiB/s,恢复速度具有可扩展性。更详细说明 请参考恢复性能和影响。 • 恢复日志备份数据,速度可以达到 30 GiB/h。更详细说明请参考PITR 的性能指标。 8.4.1.4 备份存储 TiDB 支持将数据备份到 Amazon S3、Google Cloud Storage (GCS)、Azure Blob Storage、NFS,或者实现 S3 FULL_BACKUP_TS 之前的快照备份数据。 aws s3 rm --recursive s3://backup-101/snapshot-${date} 8.4.3.3.4 PITR 的性能指标 • PITR 恢复速度,平均到单台 TiKV 节点:全量恢复 (Full Restore) 为 280 GB/h,日志恢复(Restore Meta Files 和 Restore KV Files)为 对外提供服务。 基于备份恢复的容灾方案,目前,RPO 低于 5 分钟,而 RTO 则取决于需要恢复的集群数据大小,对于 v6.5.0 版 本的 BR,其恢复速度可以参考快照恢复的性能与影响和PITR 的性能指标。通常来说,大部分客户会把跨区域 的备份作为数据安全的最后一道防线,是大多数系统都需要的。对于该方案的详细信息,请参考基于备份与 恢复的容灾方案。 另外,从 v6.5.0 开始,BR 支持基于 AWS0 码力 | 4987 页 | 102.91 MB | 10 月前3
TiDB v8.5 中文手册恢复集群快照数据备份,速度可以达到单 TiKV 存储节点 100 MiB/s,恢复速度具有可扩展性。更详细说明 请参考恢复性能和影响。 • 恢复日志备份数据,速度可以达到 30 GiB/h。更详细说明请参考PITR 的性能指标。 8.4.1.4 备份存储 TiDB 支持将数据备份到 Amazon S3、Google Cloud Storage (GCS)、Azure Blob Storage、NFS,或者实现 S3 FULL_BACKUP_TS 之前的快照备份数据。 aws s3 rm --recursive s3://backup-101/snapshot-${date} 8.4.3.3.4 PITR 的性能指标 • PITR 恢复速度,平均到单台 TiKV 节点:全量恢复 (Full Restore) 为 280 GB/h,日志恢复(Restore Meta Files 和 Restore KV Files)为 对外提供服务。 基于备份恢复的容灾方案,目前,RPO 低于 5 分钟,而 RTO 则取决于需要恢复的集群数据大小,对于 v6.5.0 版 本的 BR,其恢复速度可以参考快照恢复的性能与影响和PITR 的性能指标。通常来说,大部分客户会把跨区域 的备份作为数据安全的最后一道防线,是大多数系统都需要的。对于该方案的详细信息,请参考基于备份与 恢复的容灾方案。 另外,从 v6.5.0 开始,BR 支持基于 AWS0 码力 | 5095 页 | 104.54 MB | 10 月前3
TiDB中文技术文档重要监控指标详解 组件状态 API & 监控 监控集群 - 253 - 本文档使用 书栈(BookStack.CN) 构建 整体监控框架概述 TiDB 使用开源时序数据库 Prometheus 作为监控和性能指标信息存储方案,使用 Grafana 作为可视化组件进行 展示。 Prometheus 是一个拥有多维度数据模型,灵活的查询语句的时序数据库。Prometheus 作为热门的开源项目,拥 有活跃的社区及众多的成功案例。 Prometheus 主服务器抓取。以及 AlertManager 来实现报警机制。其结构如下图: Grafana 是一个开源的 metric 分析及可视化系统。我们使用 Grafana 来展示 TiDB 的各项性能指标 。如下 图所示: TiDB 监控框架概述 整体监控框架概述 - 254 - 本文档使用 书栈(BookStack.CN) 构建 整体监控框架概述 - 255 - 本文档使用 书栈(BookStack show binlog events in 'mysql-bin.000023' from 136676560 limit 10; Syncer 使用开源时序数据库 Prometheus 作为监控和性能指标信息存储方案,使用 Grafana 作为可视化组件进 行展示,配合 AlertManager 来实现报警。其方案如下图所示: 监控方案 Syncer - 317 - 本文档使用 书栈(BookStack0 码力 | 444 页 | 4.89 MB | 6 月前3
共 10 条
- 1













