Kubernetes 异常配置检测框架顾静, 阿里云 邓隽, 阿里云 Kubernetes 异常配置检测框架 我们来自阿里云容器服务 • 顾静,研发工程师 • 邓隽,技术专家 我们参与打造 • 容器服务(ACK/ASK) • 容器镜像服务(ACR) • 服务网格(ASM) • … 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结 Kubernetes 使用日常 • 应用部署 • API Server Pod Master API Server Pod Master API Server Pod Kubernetes 典型异常 网络异常 • 安全组、路由表配置错误 • 节点防火墙软件等修改 iptables、内核参数 • 网络链路长,手动排查成本高 异常影响 • 应用间无法正常通信 • 集群内 Controller 无法正常工作 YUM 安装自动运维工具 在集群中运行 CIS Benchmark 检测项依赖于 CIS Benchmark 内容 能发现集群核心组件配置错误 无法发现如 Flannel 组件异常 增加检查项流程较复杂 kuberhealthy 在集群中运行 CronJob 实现检查 可以自定义检查项 无法检测集群核心组件配置 集群异常时无法进行检测 kube-hunter 适用于集群安全检测 仅能检测集群安全性 kubectl-trace0 码力 | 31 页 | 9.57 MB | 1 年前3
OpenShift Container Platform 4.12 专用硬件和驱动程序启用DISCOVERY OPERATOR 3.2. 安装 NODE FEATURE DISCOVERY OPERATOR 3.3. 使用 NODE FEATURE DISCOVERY OPERATOR 3.4. 配置 NODE FEATURE DISCOVERY OPERATOR 3.5. 关于 NODEFEATURERULE 自定义资源 3.6. 使用 NODEFEATURERULE 自定义资源 3.7. 使用 kernel-abi-whitelists 以上的依赖项 用途 在出现 Driver Toolkit 之前,用户可以在 OpenShift Container Platform 中的一个 pod 中安装内核软件 包,或在构建配置中使用 entitled builds,或从主机 machine-os-content 的内核 RPM 进行安装。Driver OpenShift Container Platform 4.12 专 OperatorHub 上的社区 Operator 提供。KMM 支持树外和第三方内核驱动程序以及底层操作系统的支持软件。用户可以为 KMM 创建模块以构建和部署驱动程序容器,并支持设备插件或指标等软件。模块可以包含构建配置,用于在 Driver Toolkit 上构建基于驱动程序容器的驱动程序,或者 KMM 可以部署预构建驱动程序容器。 2.2. 拉取 DRIVER TOOLKIT 容器镜像 driver-toolkit0 码力 | 54 页 | 591.48 KB | 1 年前3
消息中间件RocketMQ原理解析 - 斩秋broker1, broker2, borker3 三台 broker 机器都配置了 Topic_A Broker1 的队列为 queue0 , queue1 Broker2 的队列为 queue0, queue2, queue3, Broker3 的队列为 queue0 当然一般情况下的 broker 的配置都是一样的 以上当 broker 启动的时候注册到 namesrv 的 Topic_A 2.5 事物消息的 load&recover TransactionStateService.load ()事物状态服务加载, 加载只是建立文件映射 redoLog 队列恢复,加载本地 redoLog 文件 tranStateTable 事物状态表, 加载本地 tranStateTable 文件 recover: 正常恢复: 利用 tranRedoLog 文件的 recover 排好序类似于记录 将所有消费端 consumer 排好序,相当于页数 然后获取当前 consumer 所在页面应该分配到的 queue 2) 按照配置来分配队列, 也就是说在 consumer 启动的时候指定了 queue 3) 按照机房来配置队列 Consumer 启动的时候会指定在哪些机房的消息 获取指定机房的 queue 然后在执行如 1)平均算法 根据分配队列的结果更新0 码力 | 57 页 | 2.39 MB | 1 年前3
consul 命令行anslate_wan_addrs配置选项结合使用时,也可以在客户端代理上设置此选项。默认情况下,-adverti e通告地址。但是,在某些情况下,所有数据中心的所有成员都不能位于同一物理或虚拟网络上,尤 是混合云和私有数据中心的混合设置。此标志使服务器节点通过公共网络为WAN进行闲聊,同时使 专用VLAN互相闲聊及其客户端代理,并且如果远程数据中心是远程数据中心,则允许从远程数据中 访问此地址时访问客户端代理。配置了tra -config-file:要加载的配置文件。有关此文件格式的更多信息,请阅读“ 配置文件”部分。可以 次指定此选项以加载多个配置文件。如果多次指定,则稍后加载的配置文件将与先前加载的配置文件 并。在配置合并期间,单值键(string,int,bool)将简单地替换它们的值,而列表类型将被附加在 起。 ● -config-dir:要加载的配置文件的目录。Consul将使用后缀“.json”或“.hcl”加载此目录中的所 hcl”加载此目录中的所 文件。加载顺序是按字母顺序排列的,并且使用与上述config-file选项相同的合并例程 。可以多次指 此选项以加载多个目录。未加载config目录的子目录。有关配置文件格式的详细信息,请参阅“ 配置 件”部分。 ● config-format:要加载的配置文件的格式。通常,Consul会从“.json”或“.hcl”扩展名中检测 置文件的格式。将此选项设置为“json”或“hcl”会强制C0 码力 | 5 页 | 346.62 KB | 1 年前3
OpenShift Container Platform 3.11 CLI 参考对于 Mac OS X 2.3.3. 对于 Linux 2.4. 基本设置和登录 2.5. CLI 配置文件 2.6. 项目 2.7. 下一步是什么? 第 第 3 章 章 管理 管理 CLI 配置集 配置集 3.1. 概述 3.2. 在 CLI 配置集间切换 3.3. 手动配置 CLI 配置集 3.4. 载入和合并规则 第 第 4 章 章 开 开发 发人 人员 员 CLI 操作 操作 4 命令是初始设置 CLI 的最佳方法,它充当大部分用户的入口点。互动流程可帮助您使用提供的凭 证建立与 OpenShift Container Platform 服务器的会话。信息自动保存在 CLI 配置文件中,然后用于后续 的命令。 以下示例显示了使用 oc login 命令进行交互式设置和登录: $ echo $PATH $ tar -xfoc: No such file Platform 服务器 URL。 命令会提示输入登录凭证:用户名和密码。 会话会根据服务器建立,并接收会话令牌。 如果您没有项目,则会提供关于如何创建项目的信息。 完成 CLI 配置后,后续的命令使用服务器、会话令牌和项目信息的配置文件。 您可以使用 oc logout 命令从 CLI 注销: 输 输出示例 出示例 如果您在创建或被授予了项目访问权限后登录,则您有权访问的项目会自动设置为当前默认值,直到 0 码力 | 45 页 | 737.95 KB | 1 年前3
Keras: 基于 Python 的深度学习库. . . . . . . . . 28 3.3.6.1 保存/加载整个模型(结构 + 权重 + 优化器状态) . . . . . . . . . 28 3.3.6.2 只保存/加载模型的结构 . . . . . . . . . . . . . . . . . . . . . . . . 29 3.3.6.3 只保存/加载模型的权重 . . . . . . . . . . . . . . . 35 3.3.18 如何在 Keras 中使用 HDF5 输入? . . . . . . . . . . . . . . . . . . . . . . . 35 3.3.19 Keras 配置文件保存在哪里? . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.20 如何在 Keras 开发过程中获取可复现的结果? . 2 从一个后端切换到另一个后端 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 14.3 keras.json 详细配置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 14.4 使用抽象 Keras 后端编写新代码0 码力 | 257 页 | 1.19 MB | 1 年前3
OpenShift Container Platform 4.6 发行注记现在,支持 RHCOS 和 MCO 的扩展 1.2.1.7. 现在支持 4Kn 磁盘 1.2.1.8. 现在支持 /var 分区 1.2.1.9. 使用 OVA 的 vSphere 的静态 IP 配置 1.2.2. 安装和升级 1.2.2.1. 将集群安装到 AWS GovCloud 区域(region) 1.2.2.2. 定义自定义 AWS API 端点 1.2.2.3. 将集群安装到 Microsoft 序的改进 1.2.2.21. 使用安装程序置备的基础架构为裸机部署改进修复失败的节点 1.2.3. 安全性与合规性 1.2.3.1. Compliance Operator 1.2.3.2. 配置 OAuth 令牌不活跃超时 1.2.3.3. 安全 OAuth 令牌存储格式 1.2.3.4. File Integrity Operator 现已正式发布 1.2.3.5. 对集群恢复失败使用的集群脚本已被更新 8. Developer Perspective (开发者视角) 1.2.6. 扩展 1.2.6.1. 集群最大限制 1.2.6.2. 添加到 Node Tuning Operator 的实时配置集 1.2.6.3. 现在完全支持 Performance Addon Operator 1.2.6.4. 使用 Intel 设备优化数据平面性能 1.2.6.5. 在控制台中管理裸机主机 10 码力 | 91 页 | 1.15 MB | 1 年前3
Hadoop 概述Hadoop 的脚本。Hadoop Common 包甚至提供了源代码和文档, 以及贡献者的相关内容。如果没有 Hadoop Common,你无法运行 Hadoop。 与任何软件栈一样,Apache 对于配置 Hadoop Common 有一定 要求。大体了解 Linux 或 Unix 管理员所需的技能将有助于你完成配 置。Hadoop Common 也称为 Hadoop Stack,并不是为初学者设计的, Distributed File System)提供一个分布 式文件系统,设计目标是能够运行在基础硬件组件之上。大多数企 业被其最小化的系统配置要求所吸引。此环境可以在虚拟机(Virtual Hadoop 大数据解决方案 4 Machine,VM)或笔记本电脑上完成初始配置,而且可以升级到服务 器部署。它具有高度的容错性,并且被设计为能够部署在低成本的 硬件之上。它提供对应用程序数据的高吞吐量访问,适合于面向大 服务——分布式系统环境下的信 息保管员。ZooKeeper 的集中管理解决方案用于维护分布式系统的 配置。由于 ZooKeeper 用于维护信息,因此任何新节点一旦加入系 统,将从 ZooKeeper 中获取最新的集中式配置。这也使得你只需要 通过 ZooKeeper 的一个客户端改变集中式配置,便能改变分布式系 统的状态。 名称服务是将某个名称映射为与该名称相关信息的服务。它类 似于0 码力 | 17 页 | 583.90 KB | 1 年前3
Docker 从入门到实践 0.4Docker Hub ii. 私有仓库 iii. 配置文件 8. 数据管理 i. 数据卷 ii. 数据卷容器 iii. 备份、恢复、迁移数据卷 9. 使用网络 i. 外部访问容器 ii. 容器互联 10. 高级网络配置 i. 快速配置指南 ii. 配置 DNS iii. 容器访问控制 iv. 端口映射实现 v. 配置 docker0 网桥 目錄 Docker —— 从入门到实践 从入门到实践 2 vi. 自定义网桥 vii. 工具和示例 viii. 编辑网络配置文件 ix. 实例:创建一个点到点连接 11. 实战案例 i. 使用 Supervisor 来管理进程 ii. 创建 tomcat/weblogic 集群 iii. 多台物理主机之间的容器互联 iv. 标准化开发测试和生产环境 12. 安全 i. 内核名字空间 ii. 控制组 iii. 服务端防护 个不同的应用就要起 10 个虚拟机,而Docker 只需要启动 10 个隔离的应用即可。 具体说来,Docker 在如下几个方面具有较大的优势。 对开发和运维(devop)人员来说,最希望的就是一次创建或配置,可以在任意地方正常运行。 开发者可以使用一个标准的镜像来构建一套开发容器,开发完成之后,运维人员可以直接使用这个容器来 部署代码。 Docker 可以快速创建容器,快速迭代应用程序,并让整个过程全程可见,使团队中的其他成员0 码力 | 179 页 | 2.27 MB | 1 年前3
石墨文档Go在K8S上微服务的实践-彭友顺日志采集 加载配置 监控采集 资源隔离 故障转移 资源调度 权限控制 标准统一 运维简单 框架简单 编译 部署 应用开发 启动方式 日志采集 加载配置 监控采集 资源隔离 故障转移 资源调度 权限控制 编译 部署 2014年6月K8S开源 微服务的生命周期 第二部分 微服务的生命周期 开发 测试 部署 启动 调用 治理 微服务的开发阶段 配置 对接 Debug • 配置驱动 • 配置补齐 • 配置工具 统一配置、调用用方式,降低开发心智负担 • Proto的管理 • 错误码管理 • 调试gRPC • 调试信息 • 错误定位 问题:每种开源组件的配置、调用方式、debug方式、记录日志方式都不一样 微服务的开发阶段 问题:gRPC未设置连接错误,阻塞模式报错不正确 Redis、MySQL连接数配置未设置?超时未设置? 配置 对接 对接 Debug • 配置驱动 • 配置补齐 • 配置工具 • Proto的管理 • 错误码管理 • 调试gRPC • 调试信息 • 错误定位 // FailOnNonTempDialError only affects the initial dial, and does not do // anything useful unless you are also using WithBlock()0 码力 | 41 页 | 3.20 MB | 1 年前3
共 257 条
- 1
- 2
- 3
- 4
- 5
- 6
- 26













