OpenShift Container Platform 4.10 专用硬件和驱动程序启用Container Platform 4.10 专用硬件和驱动程序启用 了解 OpenShift Container Platform 中的硬件启用 Last Updated: 2023-10-17 OpenShift Container Platform 4.10 专用硬件和驱动程序启用 了解 OpenShift Container Platform 中的硬件启用 法律通告 法律通告 Copyright trademarks are the property of their respective owners. 摘要 摘要 本文档概述 OpenShift Container Platform 中的硬件启用。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 目 目录 录 第 第 1 章 章 关于 关于专 专用硬件和 用硬件和驱动 驱动程序 程序启 启用 用 第 第 2 章 章 驱动 驱动程序工具包 程序工具包 2.1. 关于驱动程序工具包 2.2. 拉取 DRIVER TOOLKIT 容器镜像 2.3. 使用0 码力 | 36 页 | 360.64 KB | 1 年前3
OpenShift Container Platform 4.12 专用硬件和驱动程序启用Container Platform 4.12 专用硬件和驱动程序启用 了解 OpenShift Container Platform 中的硬件启用 Last Updated: 2024-02-17 OpenShift Container Platform 4.12 专用硬件和驱动程序启用 了解 OpenShift Container Platform 中的硬件启用 法律通告 法律通告 Copyright trademarks are the property of their respective owners. 摘要 摘要 本文档概述 OpenShift Container Platform 中的硬件启用。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 目 目录 录 第 第 1 章 章 关于 关于专 专用硬件和 用硬件和驱动 驱动程序 程序启 启用 用 第 第 2 章 章 驱动 驱动程序工具包 程序工具包 2.1. 关于驱动程序工具包 2.2. 拉取 DRIVER TOOLKIT 容器镜像 2.3. 使用0 码力 | 54 页 | 591.48 KB | 1 年前3
运维上海2017-Kubernetes与AI相结合架构、落地解析-赵慧智快速部署应用程序 • 弹性负载均衡 • 无缝升级应用 • 硬件隔离 Kubernetes 介绍 LXC (Linux Container) 介绍 在单一系统的内核层通过一套 API 在应用层提供硬件及软 件环境隔离的 Linux 环境(containers 。在内核层,通过 cgroup 来提供硬件环境的隔离(例如 CPU,Memory, Block I/O,网络等等 和通过 用来将需要容器化的应用程序及其环境进行打包后存储的镜像。 • 通常会有一个 Image 管理仓库来存储 Image。 • 同一个 Image 会有版本记录。 • 只包含软件环境的配置 • 硬件配置需要运行时去指定 OCI (Open Container Initiative) • From Linux Foundation • 旨在为 Container 格式和运行时创建开放行业标准。 运行时规范(runtime-spec • Image 规范(image-spec Container 管理工具 (User Space) 如何通过 Docker 启动 Container 并与硬件绑定 官方文档参考: https://docs.docker.com/engine/admin/resource_constraints/ Kubernetes 架构 Kubernetes0 码力 | 77 页 | 14.48 MB | 1 年前3
阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践全称:弹性裸金属服务器(神龙) • 阿里造“神龙”神龙 X-Dragon • 优势: • 性能 • 弹性 • 支持再虚拟化 2017/10 阿里云神龙正式商用 (AWS Nitro 2017/11)技术选型 • 全面上云为什么要用神龙? • 高性能:去掉了虚拟化带来的 8% 的性能损耗 • 支持二次虚拟化:使多样虚拟化技术 (Kata, Firecracker 等) 的探索和创新成为 可能 • Infrastructure (ASI) 的基石上云效率提升 物理机 (云下) 神龙裸金属 (云上) 交付周期 周 分钟级 弹性扩缩容 - 支持 性能 独占 独占 (优于普通ECS) 硬件故障率 硬盘1年故障率 2% 0.8%% (无本地盘) 硬件维修周期 [周, 月] [分钟,天]成本 效率 稳定云化架构 物理机 + 本地存储 + Underlay网 络 神龙/ECS + 远程存储 + Overlay网络 RedeployInstance (doc) 本盘数据不能 迁移运维实践 - 宕机率分析 • 宕机关联度分析 • 宕机趋势 • 机房、单元、分组 • 机型、硬件特征 • 内核版本、hotfix 一致率 • 宕机根因分析诊断 • 硬件故障、运维事件 • vmcore 归类分析 • 内核错误日志分析Machine Operator • 全生命周期 • 导入 • 下线 • 维护 • 组件终态0 码力 | 21 页 | 7.81 MB | 6 月前3
1.3 MOSN 在云原生的探索及实践等相关领域。 喜欢开源,乐于分享。 https://github.com/wangfakang MOSN 开源交流群2 目 录 MOSN 云原生演进历程 01 MOSN 网络层扩展思考和选型 02 对应解决方案和实践介绍 03 MOSN 开源进展同步 04 MOSN 云原生演进历程 MOSN 简介 — 演进历程 MOSN 从 Service Mesh 技术调研,到产品孵化,历经重重困难,最终通过双 kafka 等 协议 • 支持 Istio 1.10 • 支持 Ingress 和 Gateway • 推动 UDPA 多协议建 设 核心能力 微服务 性能优化 MOSN 网络层扩展思考和选型 MOE 背景介绍 — 什么是 MOE 处理性能高 (C++) 研发效能高 (GoLang、生态) 高性能、高研发效能、生态打通 MOE = MOSN + Envoy 相互融合,各取所长 现有的 filter 能力 • 同时具备云原生 xDS 、 REST API服务元数据管理 通道能力 • 复用 Envoy 高效网络通道,如为 Dapr 能力提供底层 gRPC 通道 • 具备硬件加速集成能力 • 内存管理 Zero Copy • MOSN/GoLang 和 Envoy 生态拉通 • 实现多个社区技术共享, 增强 Service Mesh、Dapr 等领域的生态 性能0 码力 | 36 页 | 35.61 MB | 1 年前3
阿里云上深度学习建模实践-程孟力从FM到DeepFM rt 增 加了10倍怎么优化? 2.模型效果优 化困难 1.方案复杂 Data Model Compute Platform 要求: 准确: 低噪声 全面: 同分布 模型选型: 容量大 计算量小 训练推理: 高qps, 低rt 支持超大模型 性价比 流程长、环节多: 推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动 实人认证: Service (SaaS) 机器学习框架(PAI-TensorFlow/PAI-PyTorch/Caffe /Alink/…) 计算引擎(MaxCompute / EMR / Flink) 基础硬件(CPU/GPU/FPGA/NPU) 阿里云容器服务(ACK) • 200+组件 • 数十个场景化模版 • 所见即所得 交互式建模(DSW) • JupyterLab、WebIDE • Intelligence) Deep Learning Container 数据量大而全 先进的模型结构 业务场景复杂 计算力强、性价比高 提供 支撑 支撑 支撑 促进 促进 开源生态 系统 硬件 模型 生态系统 外循环 内循环 贡献 对接 PAI平台的优势 1. 机器学习PAI: https://help.aliyun.com/product/30347.html 2.0 码力 | 40 页 | 8.51 MB | 1 年前3
Apache RocketMQ 从入门到实战busy, start flow control for a while, period in queue: %sms, size of queue: %d 二、原理解读 在进行消息中间件的选型时,如果待选中间件在功能上、性能上都能满足业务的情况下, 我各个建议把中间件的实现语言这个因素也考虑进去,毕竟选择一门用自己擅长的语言实现 的中间件会更具掌控性。在出现异常的情况下,我们可以根据自己的经验提取错误信息关键 感知 broker-a 故障的时长,其日志如下所示: 从中可以看出 192.138.3.101 的 nameserver 基本在 2 分钟左右才感知其宕机,即虽 然机器在重启,但可能由于操作系统要做硬件自检等其他原因,TCP 连接并未断开,故 nameserver 在 120s 后才感知其宕机,从路由信息表中将该 broker 移除,那按照路由剔 除机制,客户端应该在 150 秒的时间内感知其变化,那为什么没感知呢?0 码力 | 165 页 | 12.53 MB | 1 年前3
Apache APISIX
微服务⽹关性能架构解析upstream Configuration center ??? Validator ??? Apache APISIX 技术选型 • 配置中⼼心 • 语⾔言或开发平台 • 数据校验 • 加分项:顶级路路由实现 Apache APISIX 技术选型 • 配置中⼼心:⾼高可⽤用、增量量订阅、历史记录 • 语⾔言或开发平台:动态、⾼高性能、⽹网关的周边资 源丰富 • 数据校验:开放标准、有⼀一定的⽣生态系统 APISIX 技术选型 配置中⼼心 why etcd? • 集群⽀支持 • 历史+事务 • 低于毫秒的变化通知 Apache APISIX 技术选型 开发平台:Lua 或 Golang •OpenResty >= 1.15.8 •Tengine >= 2.3.2 •基于 Nginx •调⽤用动态库:C/C++,Golang 等 Apache APISIX 技术选型 数据校验:jsonschema • 数据校验规范:Google 排名第⼀一 • 有多个不不同语⾔言客户端,涵盖了了⼏几乎⽬目前主流的 所有语⾔言实现。 • 有现成的压测结果供参考供对⽐比 Apache APISIX 技术选型 validator:iresty/jsonschema • 刚需:draft4(可满⾜足 99% 的场景), draft6 和 draft7 是未来 • 经历:lua-rapidjson0 码力 | 41 页 | 15.62 MB | 1 年前3
《TensorFlow 2项目进阶实战》6-业务落地篇:实现货架洞察Web应⽤• 展现 AI 效果理论:使用 OpenCV 可视化识别结果 • 展现 AI 效果实战:使用 OpenCV 可视化识别结果 • 搭建 AI SaaS 理论:Web 框架选型 • 搭建 AI SaaS 理论:数据库 ORM 选型 • 搭建 AI SaaS 理论:10 分钟快速开发 AI SaaS • 搭建 AI SaaS 实战:10 分钟快速开发 AI SaaS • 交付 AI SaaS:10 TensorFlow” Try it! 搭建 AI SaaS 理论:Web 框架选型 Python Web 框架 Python Web 框架 - Flask Python Web 框架 - Flask Flask 常用扩展 Flask 项目常见目录结构 启动文件 manage.py 示例 搭建 AI SaaS 理论:数据库 ORM 选型 ORM 是什么 ORM 是什么 常见的 Python ORM0 码力 | 54 页 | 6.30 MB | 1 年前3
大规模微服务架构下的Service Mesh探索之路敖小剑6月初在深圳举行的GIAC全球互联网架构大会上,蚂蚁金服第一次对外 透露了开发中的Service Mesh产品——Sofa Mesh。 今天我们将展开更多细节,详细介绍蚂蚁金服Sofa Mesh的技术选型, 架构设计以及开源策略。 前言技术选型 Technical 1ü 性能要求 • 以蚂蚁金服的体量,性能不够好则难于接受 • 架构与性能之间的权衡和取舍需要谨慎考虑 ü 稳定性要求 • 以蚂蚁金服的标准,稳定性的要求自然是很高 非常有意思的轻量ServiceMesh实践 • 从Istio中剥离Pilot和Envoy • 去掉Mixer和Auth • 定制Pilot,实现ETCD Adapter • 脱离k8s运行Sofa Mesh在技术选型时考虑 Envoy • 数据平面:Envoy最符合要求 • XDS API的设计更是令人称道 • C++带来的技术栈选择问题 • 我们有太多的扩展和定制 • 而且,proxy不仅仅用于mesh0 码力 | 37 页 | 7.99 MB | 6 月前3
共 121 条
- 1
- 2
- 3
- 4
- 5
- 6
- 13













