业务框架升级 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

升级OpenShift Data Science Self-managed

1.22 升级 OpenShift Data Science Self-managed 了解如何在 OpenShift Container Platform 上升级 Red Hat OpenShift Data Science Last Updated: 2023-07-03 Red Hat OpenShift Data Science Self-managed 1.22 升级 OpenShift OpenShift Data Science Self-managed 了解如何在 OpenShift Container Platform 上升级 Red Hat OpenShift Data Science 法律通告法律通告 Copyright © 2023 Red Hat, Inc. The text of and illustrations in this document are licensed trademarks are the property of their respective owners. 摘要摘要了解 OpenShift Data Science Operator 升级过程。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 9 页 | 101.96 KB | 1 年前
3
IstioMeetupChina 服务网格热升级技术分享

IstioMeetup 服务网格数据平面热升级技术分享 ServiceMesh Data-Plane Hot-Upgrade 阿里云服务网格团队 – 史泽寰 • 为什么需要服务网格数据面热升级 • 实现热升级 • 实践热升级目录 Catalog 2 为什么需要服务网格数据面热升级 Why do we need Hot-Upgrade for ServiceMesh Data-Plane Data-Plane • 造成请求失败，影响业务质量 • 重启Pod导致业务容器也被重启，需要执行重新初始化 • 不增加workload数量升级，则服务容量受损 • 增加workload保持服务容量不变，应对大规模场景难以在扩容规模和操作便捷度上取得令人满意的平衡传统Sidecar升级方式的缺点 3 为什么需要服务网格数据面热升级 Why do we need Hot-Upgrade for ServiceMesh Data-Plane • 只替换/重启Sidecar • 替换/重启过程中进/出不会出现请求失败，连接失败 • 易于运维，可以控制升级策略理想的Sidecar升级 4 • 为什么需要服务网格数据面热升级 • 实现热升级 • 实践热升级目录 Catalog 5 • Envoy热重启 • 以Epoch + 1的方式启动新实例，触发热重启 • ListenSocket转移到新实例

0 码力 | 14 页 | 2.25 MB | 1 年前
3
Kubernetes 异常配置检测框架

Kubernetes 异常配置检测框架我们来自阿里云容器服务 • 顾静，研发工程师 • 邓隽，技术专家我们参与打造 • 容器服务（ACK/ASK） • 容器镜像服务（ACR） • 服务网格（ASM） • … 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结 Kubernetes 使用日常 • 应用部署 • 集群扩容 • 组件升级 • … • 找出集群不正常工作的原因 Kubernetes 典型异常组件异常 • API Server Load Balancer 异常 • API Server Pod 异常影响 • 通过 API Server 访问集群概率失败 • 升级集群失败 Load Balancer Service Master API Server Pod Master API Server Pod Master API Server Kernel 仅能检测 Kernel 相关问题要求熟悉 bpftrace 语言 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结我们的目标实现 Kubernetes 集群异常检测框架支持集群多维度异常检测能力支持集成开源检测组件检测框架 Ver.1 { 自动化 Ver.1 自动化 Autopilot Engine Command Policy

0 码力 | 31 页 | 9.57 MB | 1 年前
3
百度APP基于Istio实现基础架构升级 - lightning talk - MichaelXu

#IstioCon 百度APP基于Istio实现基础架构升级许超 #IstioCon 背景 l 核心业务线已完成微服务改造，数万个微服务对架构服务治理能力提出了更高的要求。 l 高级架构能力能否多语言、多框架支持？ l 运维架构能力是否具备可移植性？是否能低成本复制新的产品线？ l 可观测性不足，是否有通用机制提升产品线可观测性？ Ø 部分模块上下游超时配置不合理，超时倒挂，集中管理调整成本比较高。部分模块上下游超时配置不合理，超时倒挂，集中管理调整成本比较高。 Ø 多数模块对单点异常，慢节点等异常缺乏容忍能力，推动每个模块独立修复，成本高，上线周期长。 Ø 因重试导致雪崩，底层RPC框架需要重复建设来定制动态熔断能力。 Ø 升级一级服务建设中，发现很多模块单点、多点故障不能容忍，能否低成本解决？ Ø 比如常用运维降级、止损能力各个产品线重复建设，方案差异大，OP期望运维能力在不同产品线之间能够通用化，集中化管理，甚至做到自动决策内核劫持：Loopback方案 Ø loopback地址的管理和分配。 Ø 需要打通业务和loopback之间的映射管理。 RPC劫持：可扩展方案 Ø envoy启动后注册port到bns-agent。 Ø rpc框架查询bns-agent IP与治理策略数据。 Ø bns-agent判断否使用envoy进行服务治理。 Ø rpc框架根据反馈的IP，治理策略信息请求对应IP，会cache数据，需要即时更新。

0 码力 | 9 页 | 2.20 MB | 1 年前
3
《TensorFlow 2项目进阶实战》6-业务落地篇：实现货架洞察Web应⽤

业务落地篇：实现货架洞察 Web 应用扫码试看/订阅《 TensorFlow 2项目进阶实战》视频课程 • 串联 AI 流程理论：商品检测与商品识别 • 串联 AI 流程实战：商品检测与商品识别 • 展现 AI 效果理论：使用 OpenCV 可视化识别结果 • 展现 AI 效果实战：使用 OpenCV 可视化识别结果 • 搭建 AI SaaS 理论：Web 框架选型 • 搭建 AI AI 效果实战：使用 OpenCV 可视化识别结果 “Hello TensorFlow” Try it！搭建 AI SaaS 理论：Web 框架选型 Python Web 框架 Python Web 框架 - Flask Python Web 框架 - Flask Flask 常用扩展 Flask 项目常见目录结构启动文件 manage.py 示例搭建 AI SaaS 理论：数据库

0 码力 | 54 页 | 6.30 MB | 1 年前
3
QCon北京2017/支撑海量业务的互联网架构/知乎基于 Kubernetes 的 Kafka 平台探索和实践

分布式的流式数据平台⾼高吞吐容错性 Broker Broker Broker Producer Consumer Topic Topic Topic Producer Consumer 平台承载知乎业务⽇日志、数据传输和消息队列列服务平台线上稳定运⾏行行基于 Kubernetes 的 Kafka 集群 13 个， 1000+ Topic 知乎技术平台重要的组件 Kafka 在知乎的应⽤用多集群 • ⾼高可⽤用为什什么采⽤用 Kubernetes 问题驱动 • Kafka 资源规划不不合理理 • 单⼀一集群造成系统单点 • 不不区分集群和 Topic 等级，影响重要业务 • 业务与 Kafka 深度耦合多 Kafka 集群⽅方式根据 Topic 类型划分集群同⼀一类型 Topic 的集群细分 • Topic 服务等级、容量量和规模划分资源规划多变需求引发集群规模增⻓长优化磁盘调度算法 • 运⽤用 Kafka 机架感知特性服务注册和客户端注册 Topic 的集群信息 • Broker, Zookeeper • Status 是否启⽤用客户端 • 业务易易⽤用 • 标准客户端，降低集群⻛风险集群容错 • 灾备集群 • 保证重要 Topic ⾼高可⽤用 • 客户端与服务器器注册联动指标维度举例例 Kubernetes 3 容器器内存、CPU、运⾏行行状态

0 码力 | 34 页 | 2.64 MB | 1 年前
3
22-云原生的缘起、云原生底座、PaaS 以及 Service Mesh 等之道-高磊

率低，故障排查慢，阻碍了软件价值的流动无法满足用户对于业务快速研发、稳定交付的要求场景 1 如果生产中一台Web应用服务器故障，恢复这台服务器需要做哪些事情？场景 2 如果应用负载升高/降低，如何及时、按需扩展/收缩所用资源？场景 3 如果业务系统要升级，如何平滑升级？万一升级失败是否能够自动回滚？整个过程线上业务持续运行不中断。传统稳态业务环境难以高效承载敏态应用发现故障（假死）如果生产中一台Web应用服务器故障，恢复这台服务器需要做哪些事情？场景 2 如果应用负载升高/降低，如何及时按需扩展/收缩所用资源？场景 3 如果业务系统要升级，如何平滑升级？万一升级失败是否能够自动回滚？整个过程线上业务持续运行不中断。传统稳态业务环境难以高效承载敏态应用发现故障（假死）创建新实例配置运行环境部署当前应用版本添加监控配置日志采集测试确认服务正常运行传统实践中，主要采用虚机/物理机+SpringCloud等微服务框架的方式承载微服务应用。但在一个虚机/服务器上部署多个微服务会产生如下问题—— • 资源预分配，短时间内难以扩展 • 缺乏隔离性，服务相互抢占资源 • 增加环境、网络（端口）和资源管理的复杂性，治理成本高 • 监控粒度难以满足微服务应用运维的需要，线上问题难以排查定位，往往需要研发介入我们需要一种新型的、为云而生的业务承载平台，去应对上述问题。微服务应用

0 码力 | 42 页 | 11.17 MB | 6 月前
3
蚂蚁金服双十一 Service Mesh 超大规模落地揭秘

黄挺(鲁直) 蚂蚁金服微服务以及云原生负责人雷志远(碧远) 蚂蚁金服中间件 RPC 负责人2 个⼈人简介雷志远（碧远）蚂蚁金服 RPC 负责人主要 Focus 领域： * 服务框架：SOFARPC（已开源） * Service Mesh：MOSN（已开源）黄挺（鲁直）蚂蚁金服云原生负责人主要 Focus 领域： * SOFAStack 微服务领域 * Service Mesh-现状 5.客户端中间件版本的统一 9% 3.流量调度的诉求 18% 4.框架不断升级 14% 2.机器资源逐年增加 27% 1.业务和框架耦合 32%8 因为我们要解决在 SOA 下面，没有解决但亟待解决的：基础架构和业务研发的耦合，以及未来无限的对业务透明的稳定性与高可用相关诉求。为什么要 Service Mesh-结论9 为什么要 ServiceMesh-结论-方案 ServiceMesh-结论-方案应用A 应用应用B 应用C 应用D 应用E SOA 解耦了不同的业务团队之前的耦合服务注册中心客户端限流熔断客户端动态配置客户端故障注入客户端 Service Mesh 解耦了业务开发与基础团队之前的耦合应用代码业务应用开发基础设施开发 Mesh 化10 三、方案落地方案落地11 最终选型：自研数据面+轻量 SDK，我们给出的答案是

0 码力 | 26 页 | 2.71 MB | 6 月前
3
Kubernetes全栈容器技术剖析

3 华为云应用服务：让企业应用上云更简单，运行更高效计算（ECS/BMS/ARM）存储（EVS/OBS/SFS）网络（VPC/EIP）开源原生商业增强：控制面HA、跨AZ高可用、滚动升级、裸金属容器云容器引擎 CCE 微服务引擎 CSE 开源原生企业级中间件分布式缓存 DCS 分布式消息 DMS 分布式数据库 DDM 应用编排引擎 AOS 5个maintainer，commits 3144  CNCF初创成员，国内唯一白金会员  K8S社区技术指导委员会13席位之一，国内唯一  首批KSCP认证厂商之一  主导核心设计：主导设计集群联邦，支持多调度器框架、亲和性调度策略，集群部署、运维监控增强，安全加固 CNCF & Kubenetes 社区  全球TOP3、国内TOP1贡献： 7个maintainer，commits 1200+  多样的生态接入 • 支持多语言多框架服务接入 • 支持第三方模板和镜像快速部署完全开放的原生平台 • 紧跟Kubernetes和Docker社区，迅速同步最新版本 • 支持原生API调用和命令行操作增强的商用化特性 • 通过自动化配置、构建、部署提升业务上线效率 • 通过跨可用区高可用和控制面HA提升业务可靠性 • 通过物理共享集群提供敏捷可靠的容器适应业务多样性高性能基础设施

0 码力 | 26 页 | 3.29 MB | 1 年前
3
Apache RocketMQ 从入门到实战

有些什么条件呢？ 1. 扎实的 Java 基础功底一个开源项目的底层都会涉及到存储，这就要求具备一定的数据结构基础，JAVA 集合框架中的类自然成为了我们突破数据结构最好的老师，其次是 java 并发，即多线程、并发容器、锁等课题，这方面可以好好学习一下 JUC 框架。最后最好是具备一些网络方面的知识，例如 NIO、Netty。 2. 持续输出能力成为一个开源项目的 contributions 看看官方文档，特别是设计手册，从整体上把握其设计理念。  写写源码分析类文章，从整体上把控这个框架，这个花费时间较多，如果框架正在起步。阶段，不建议该方法；如果框架比较成熟，非常建议采用该方法。  尝试看看开源项目中的 issues，看能不能解决，从问题入手，快速融入该项目。  尝试谢谢单元测试用例，测试驱动开发，借此学习该框架。后面的事情就是坚持不懈，朝着目标不断前进，中途可以放慢速度，但千万别放弃，因弃，因为只有坚持，才能胜利，只要前进，就离目标更近。参与开源，一个最基本的条件是拥有大量的连续时间，想要成为一个开源框架的 Committer ,唯有坚持不懈，持续投入，持续产出。最后再次感谢 RocketMQ 社区对我的认可，我会尽努力做出更大的贡献，也希望广大读者朋友们，积极参与开源社区，贡献一份自己的力量，同事打造自身影响力，助力职场步步高升。本文来自『中间件兴趣圈

0 码力 | 165 页 | 12.53 MB | 1 年前
3

共 261 条前往

页

分类

语言

格式

升级OpenShift Data Science Self-managed

IstioMeetupChina 服务网格热升级技术分享

Kubernetes 异常配置检测框架

百度APP基于Istio实现基础架构升级 - lightning talk - MichaelXu

《TensorFlow 2项目进阶实战》6-业务落地篇：实现货架洞察Web应⽤

QCon北京2017/支撑海量业务的互联网架构/知乎基于 Kubernetes 的 Kafka 平台探索和实践

22-云原生的缘起、云原生底座、PaaS 以及 Service Mesh 等之道-高磊

蚂蚁金服双十一 Service Mesh 超大规模落地揭秘

Kubernetes全栈容器技术剖析

Apache RocketMQ 从入门到实战