OpenShift Container Platform 4.10 可伸缩性和性能第 第 14 章 章 低延 低延迟节 迟节点的 点的 PERFORMANCE ADDON OPERATOR 14.1. 了解低延迟 14.2. 安装 PERFORMANCE ADDON OPERATOR 14.3. 升级 PERFORMANCE ADDON OPERATOR 14.4. 置备实时和低延迟工作负载 14.5. 使用性能配置集调整节点以实现低延迟 14.6. 使用 PERFORMANCE NIC 队列 14.7. 调试低延迟 CNF 调整状态 14.8. 为红帽支持收集调试数据延迟 第 第 15 章 章 为 为平台 平台验证执 验证执行延 行延迟测试 迟测试 15.1. 运行延迟测试的先决条件 15.2. 关于延迟测试的发现模式 15.3. 测量延迟 15.4. 运行延迟测试 15.5. 生成延迟测试失败报告 15.6. 生成 JUNIT 延迟测试报告 15.7. 在单节点 在单节点 OPENSHIFT 集群上运行延迟测试 15.8. 在断开连接的集群中运行延迟测试 15.9. 对 CNF-TESTS 容器的错误进行故障排除 78 78 78 80 80 82 83 84 87 87 87 90 90 92 92 94 94 94 95 96 96 96 100 100 100 101 103 104 106 106 1060 码力 | 315 页 | 3.19 MB | 1 年前3
OpenShift Container Platform 4.14 发行注记网络堆栈可以动态使用非保留 CPU。默认情况下,这种非保留 CPU 的动态使用发生在机器配置池中应用有性能配置集的节点。可用的非保留 CPU 的动态使用可最大化 OVS 的计算资源,并在高需求期间为工作负载最小化网络延迟。OVS 仍然无法在 Guaranteed QoS pod 中动态使用分配给容器的隔离 CPU。这种分离可避免对关键应用程序工作负载造成中断。 注意 注意 当 Node Tuning Operator 识别性能条件来激活使用非保留 CPU 时,OVN-Kubernetes 配 置 CPU 上运行的 OVS 守护进程的 CPU 关联性对齐。在这个窗口中,如果一个 Guaranteed QoS pod 启动,它可能会遇到延迟激增。 1.3.9.5. 多个 多个 IP 地址的双 地址的双栈 栈配置 配置 在以前的 Whereabouts IPAM CNI 插件版本中,每个网络接口只能分配一个 IP 地址。 现在,Whereabouts (PAO) must-gather 镜像不再需要作为 must-gather 命令 的参数,以捕获与低延迟调整相关的调试数据。PAO must-gather 镜像的功能现在在没有镜像参数的 must-gather 命令使用的默认插件镜像下。有关收集与低延迟调整相关的调试信息的更多信息,请参阅为 红帽支持收集低延迟调试数据。 1.3.21.2. 使用 使用 Operator 的 的 must-gather0 码力 | 73 页 | 893.33 KB | 1 年前3
OpenShift Container Platform 4.14 分布式追踪distributed tracing 平台来监控、网络性能分析,并对现代、云原生的微服务应用程 序中组件间的交互进行故障排除。 使用分布式追踪平台,您可以执行以下功能: 监控分布式事务 优化性能和延迟时间 执行根原因分析 分布式追踪平台由三个组件组成: Red Hat OpenShift distributed tracing Platform (Jaeger),它基于开源 Jaeger 项目。 distributed tracing 平台来监控、网络性能分析,并对现代、云原生的微服务应用程 序中组件间的交互进行故障排除。 使用分布式追踪平台,您可以执行以下功能: 监控分布式事务 优化性能和延迟时间 执行根原因分析 分布式追踪平台由三个组件组成: Red Hat OpenShift distributed tracing Platform (Jaeger),它基于开源 Jaeger 项目。 distributed tracing 平台来监控、网络性能分析,并对现代、云原生的微服务应用程 序中组件间的交互进行故障排除。 使用分布式追踪平台,您可以执行以下功能: 监控分布式事务 优化性能和延迟时间 执行根原因分析 分布式追踪平台由三个组件组成: OpenShift Container Platform 4.14 分布式追踪 分布式追踪 8 Red Hat OpenShift distributed0 码力 | 100 页 | 928.24 KB | 1 年前3
OpenShift Container Platform 3.11 扩展和性能指南重要 重要 并行行为可能会认为内容源,如您的镜像 registry 或 Red Hat Satellite 服务器。准备服务 器的基础架构 pod 和操作系统补丁可帮助防止出现这个问题。 从最低延迟控制节点(LAN 速度)运行安装程序。不建议在广域网络(WAN)上运行,因此不会因为丢失 的网络连接运行安装。 Ansible 为 性能和扩展提供了自己的指导,包括使用 RHEL 6.6 或更高版本来确保 etcd。 通过以下方法优化此流量路径: 在 master 主机上运行 etcd。默认情况下,etcd 在所有 master 主机上的静态 pod 中运行。 确保 master 主机之间有一个不协调、低延迟 LAN 通信链接。 OpenShift Container Platform master 会积极缓存资源的反序列化版本,以简化 CPU 负载。但是,如果 较小的 pod 集群小于 1000 个 [1]、Azure 磁 盘 File 在 OS 中作为要挂载的文件系统导出 也称为网络附加存储(Network Attached Storage,NAS) 取决于不同的协议、实现、厂商及范围,其并 行性、延迟、文件锁定机制和其它功能可能会 有很大不同。 聚合模式/独立于模式 GlusterFS [1], RHEL NFS, NetApp NFS [2], Azure File, Vendor NFS0 码力 | 58 页 | 732.06 KB | 1 年前3
OpenShift Container Platform 4.13 虚拟化Platform 集群节点是否可以运行带 有零数据包丢失的 Data Plane Development Kit (DPDK) 工作负载的虚拟机。 您可以将 虚拟机配置为运行 DPDK 工作负载,以实现较低延迟和更高的吞吐量,以便在用户空间 中更快地处理数据包。 现在,您可以使用其完全限定域名 (FQDN) 从集群外部访问附加到二级网络接口的虚拟机。 现在,您可以使用 OpenShift Virtualization CPU)专用于特定的一个虚拟机。 10.15.8.1. 关于 关于专用 用资源 源 当为您的虚拟机启用专用资源时,您的工作负载将会在不会被其他进程使用的 CPU 上调度。通过使用专 用资源,您可以提高虚拟机性能以及延迟预测的准确性。 10.15.8.2. 先决条件 先决条件 节点上必须配置 CPU Manager。在调度虚拟机工作负载前,请确认节点具有 cpumanager = true 标签。 虚拟机必须关机。 "on" vlan: 1019 第 第 10 章 章 虚 虚拟 拟机 机 199 3. 可选:运行虚拟机延迟检查以验证网络是否已正确配置。 4. 可选:运行 DPDK 检查,以验证命名空间是否已准备好 DPDK 工作负载。 其他 其他资 资源 源 处理项目 虚拟机延迟检查 DPDK 检查 10.18.4.7. 为 DPDK 工作 工作负载配置虚 配置虚拟机 机 您可以在虚拟机0 码力 | 393 页 | 4.53 MB | 1 年前3
OpenShift Container Platform 4.14 更新集群频道的发行版本将提升到 fast 频道,则会发布勘误,并完全支持该发 行版本。 延迟后,fast 频道中的一个发行版本最终会提升到 stable 频道。这个延迟代表了 fast 和 stable 频道之间的唯一区别。 注意 注意 对于最新的 z-stream 版本,这个延迟通常是一周或两周。但是,初始更新到最新 次版本的延迟可能需要更长的时间,通常为 45-90 天。 提升到 stable 频道的版本同时提升到 fast 和 stable 频道中发行版本的唯一区别在于,一个发行版本仅会在出现在 fast 频道一段时间 后才会出现在 stable 频道中,这样做可以有更长的时间来发行在更新中可能存在的风险。 在这个延迟后,fast 频道中可用的发行版本始终在 stable 频道中可用。 如果一个更新被支持但不推荐使用意味着什么? 如果一个更新被支持但不推荐使用意味着什么? 红帽会持续评估来自多个源的数据,以确 如果特定版本的更新不再被推荐意味着什么? 如果因为回归的问题,红帽从任何支持的发行版本中删除更新建议,则会为更正回归的未来版本 提供取代的更新建议。当缺陷被修正、测试并提升到您选择的频道时,可能会有延迟。 什么 什么时 时候下一个 候下一个 z-stream 版本会在 版本会在 fast 和 和 stable 频 频道中出 道中出现 现? ? 虽然特定节奏可能会因多个因素而异,但对最新次版本的新0 码力 | 149 页 | 1.94 MB | 1 年前3
OpenShift Container Platform 4.7 日志记录Container Platform 中,您无法更改无限期重试行 为。 这些参数可帮助您权衡延迟和吞吐量之间的利弊。 要优化 Fluentd 的吞吐量,您可以使用这些参数通过配置较大的缓冲和队列、延迟清除以及设置 重试间隔间的更多时间来减少网络数据包的数量。请注意,大型缓冲区需要在节点文件系统有更 多空间。 要优化低延迟,您可以使用参数尽快发送数据,避免批量的构建,具有较短的队列和缓冲,并使 用更频繁的清理和重试。 Immediate: 在将数据添 加到一个块后马上清理 块。 interval flushThreadCount 执行块清除(flushing)的线程数 量。增加线程数量可提高冲刷吞吐 量,这会隐藏网络延迟的情况。 2 overflowAction 当队列满时块的行为: throw_exception:发 出一个异常并在日志中显 示。 block:停止对数据进行 块除了,直到缓冲区已用 完的问题被解决为止。 Elastic Query/Fetch Latency Sum Query latency:Elasticsearch 搜索查询执行的 平均时间。 获取延迟:每个 Elasticsearch 搜索查询的平 均时间获取数据。 获取延迟的时间通常比查询延迟要短。如果抓取延迟 持续增加,则代表磁盘、数据配置速度较慢,或者带 有许多结果的大量请求。 Elastic 查询率 每个 Elasticsearch 节点每秒对0 码力 | 183 页 | 1.98 MB | 1 年前3
OpenShift Container Platform 4.8 日志记录Container Platform 中,您无法更改无限期重试行 为。 这些参数可帮助您权衡延迟和吞吐量之间的利弊。 要优化 Fluentd 的吞吐量,您可以使用这些参数通过配置较大的缓冲和队列、延迟清除以及设置 重试间隔间的更多时间来减少网络数据包的数量。请注意,大型缓冲区需要在节点文件系统有更 多空间。 要优化低延迟,您可以使用参数尽快发送数据,避免批量的构建,具有较短的队列和缓冲,并使 用更频繁的清理和重试。 Immediate: 在将数据添 加到一个块后马上清理 块。 interval flushThreadCount 执行块清除(flushing)的线程数 量。增加线程数量可提高冲刷吞吐 量,这会隐藏网络延迟的情况。 2 overflowAction 当队列满时块的行为: throw_exception:发 出一个异常并在日志中显 示。 block:停止对数据进行 块除了,直到缓冲区已用 完的问题被解决为止。 Elastic Query/Fetch Latency Sum Query latency:Elasticsearch 搜索查询执行的 平均时间。 获取延迟:每个 Elasticsearch 搜索查询的平 均时间获取数据。 获取延迟的时间通常比查询延迟要短。如果抓取延迟 持续增加,则代表磁盘、数据配置速度较慢,或者带 有许多结果的大量请求。 Elastic 查询率 每个 Elasticsearch 节点每秒对0 码力 | 223 页 | 2.28 MB | 1 年前3
OpenShift Container Platform 4.8 Service Mesh定义、验证并观察 Istio 服务网格。它所提供的拓扑结构可以帮助您了解服务网格的结构,并提供服务网 格的健康状况信息。 Kiali 实时提供命名空间的交互式图形视图,可让您了解诸如电路断路器、请求率、延迟甚至流量图等功 能。Kiali 提供了从应用程序到服务以及负载等不同级别的组件的了解,并可显示与所选图形节点或边缘的 上下文信息和图表的交互。Kiali 还提供了验证 Istio 配置(如网关、目的规则、虚拟服务、网格策略等 分布式追踪是用来将不同工作单元的信息关联起来的技术,通常是在不同进程或主机中执行的,以便理解 分布式事务中的整个事件链。分布式追踪可让开发人员在大型服务架构中视觉化调用流程。它对理解序列 化、平行和延迟来源会很有价值。 分布式追踪平台记录了在微服务的整个堆栈间执行单个请求,并将其显示为 trace。trace是系统的数据/ 执行路径。端到端追踪包含一个或多个范围。 span 代表具有操作名称、 架构相关的信息。您可以使用分 布式追踪来监控、网络性能分析,并对现代、云原生的基于微服务的应用中组件之间的交互进行故障排 除。 通过分布式追踪,您可以执行以下功能: 监控分布式事务 优化性能和延迟时间 执行根原因分析 Red Hat OpenShift distributed tracing 包括两个主要组件: Red Hat OpenShift distributed tracing0 码力 | 344 页 | 3.04 MB | 1 年前3
OpenShift Container Platform 4.13 网络如果把这个值设置得太短,对于 edge-terminated, reencrypted, 或 passthrough 的路由,则可能会导致路由器回退到使用默认证书,即使 正在使用一个更加匹配的证书时也是如此。默认检查延迟为 5s。 tunnelTimeout 指定隧道连接在隧道闲置期间保持打开的时长,包括 websockets。默认超时为 1h。 maxConnections 指定每个 HAProxy 进程可建立的最大同时连接 Controller 配置了自定义默认证书。 流程 流程 要删除自定义证书并恢复 OpenShift Container Platform 附带的证书,请输入以下命令: 集群协调新证书配置时可能会有延迟。 验证 验证 要确认原始集群证书已被恢复,请输入以下命令: 其中:指定集群的基域名。 输出示例 apiVersion: operator.openshift.io/v1 my-application OpenShift Container Platform 4.13 网 网络 络 68 注意 为压缩分配的内存可能会影响最大连接。此外,对大型缓冲区的压缩可能导致延迟,如非 常复杂的正则表达式或较长的正则表达式列表。 并非所有 MIME 类型从压缩中受益,但 HAProxy 仍然使用资源在指示时尝试压缩。通常而 言,文本格式(如 html、css 和 js)与 0 码力 | 697 页 | 7.55 MB | 1 年前3
共 38 条
- 1
- 2
- 3
- 4













