Alluxio 助力 Kubernetes, 加速云端深度学习HDFS接口客户端 POSIX接口客户端 Alluxio 服务器 Alluxio 服务器 大数据查询 大数据ETL 模型训练 Alluxio核心功能三:统一的文件系统抽象 Alluxio 服务器 Alluxio在云端AI训练场景的性能好处 • 支持大规模的数据缓存 • 本地内存加速 • 支持数据预热 • LRU缓存管理 Object storage (Fuse) Worker K8S node Alluxio Worker Pod RAM/SSD/HDD fuse K8S node K8S node Alluxio Worker Pod RAM/SSD/HDD fuse K8S node Alluxio Worker Pod RAM/SSD/HDD fuse TensorFlow TensorFlow Alluxio Master Pod file.readtype.default CACHE 默认的CACHE_PROMOTE会带来显著的性能开销 策略:1.优先本地加载缓存 2.避免数据震荡 3.避免数据冗余 1 2 3 3. Fuse性能调优 • 选择更高版本的kernel • 设置max_read=131072 • 定制libfuse2代码,支持配置Libfuse线程池 • 延长元数据缓存时间 建议 端到端的优化方案0 码力 | 22 页 | 11.79 MB | 1 年前3
sealos 以 kubernetes 为内核的云操作系统01 对接 firecracker cilium openebs 等技术 无性能损失的网络层计量 与隔离 rust 自研分布式文件系统 sealfs 直接对接 rustvmm 绕 开 fuse 02 client manger manger metadata data data metadata metadata Data and metadata store in different 不在磁盘级别提供高可用 所以高可用交给 KB rocketmq 这些应用自身去解决 业务起的有状态容器可用 sealfs 文件系统 sealfs 直接从容器拦截 IO,对接 sealfs 分布式文件系统,避免 fuse 用户态内核态反复横跳 在 Sealos 上使用 GPU 在 Sealos 上利用 Cilium + BPF 实现流量统计 Slide source credit to: How to Make0 码力 | 29 页 | 7.64 MB | 9 月前3
Kubernetes日志平台建设最佳实践-元乙��Trace�� ������ ������ ������ �� • ��������������� • ������������������ • ������ • ���� ������� �� •FUSE���� •All in DaemonSet ���� •����� •������ ��� •������ •������� Automation •����� •��ITOps��0 码力 | 30 页 | 53.00 MB | 1 年前3
k8s操作手册 2.3#如果要启用CRI-Plugin,注释掉其中的 disabled_plugins = ["cri"] #再重启containerd即可有 unix:///run/containerd/containerd.sock 接口 #信任私有镜像仓库ssl证书,添加或修改以下几行配置 [plugins."io.containerd.grpc.v1.cri".registry.configs] [plugins ainerd的镜像及容器等信 息 安装了containerd后,containerd的命令行工具为ctr,而k8s v1.24之后版本又新 增额外的辅助工具crictl crictl是遵循CRI接口规范的一个命令行工具,通常用它来检查和管理kubelet节点 上的容器运行时和镜像。(支持containerd/docker/crio) ★安装crictl工具 默认随kubeadm一起安装了,在cri-tools-xxxx now deprecated, you should set the endpoint instead. #crictl默认会依次读取以上3个接口 ★设置crictl连接containerd的cri接口 # cat > /etc/crictl.yaml <0 码力 | 126 页 | 4.33 MB | 1 年前3
石墨文档Go在K8S上微服务的实践-彭友顺解码 CI check 阶段 • 主要做 pb 的 format、lint、breaking 检查。 CI build 阶段 • 会基于 pb 的注释自动产生文档,并推送至内部的微服务管理系统接口平台中 • 会生成 Go/PHP/Node/Java 桩代码和错误码,推送到指定的仓库 开发阶段 • go get 客户端、服务端的gRPC和错误码的代码 配置 对接 Debug • 配置驱动 • 错误定位 微服务的测试阶段 测试类型 工具生成测试用例 简单高效做单元测试 • 单元测试 • 本地docker-compse • 提交代码,触发gitlab ci • 接口测试 • 接口平台 • 性能测试 • benchmark • 全链路压测 • 集成测试 • 以前gitlab ci,docker in docker • 目前结合配置中心拓扑图,自动生成jekins编排,ing --go-test_out=pkg=main,paths=source_relative:. helloworld.proto • 业务代码中不要有框架、组件代码,减少单侧用例 • 业务代码做好接口级别单测,简单,快速 • protobuf工具的插件,拿到gRPC服务的描述信息,生成单元测试用例 • 业务人员只需要填写红框内容的断言内容,就可以完成单元测试 微服务的测试阶段 测试类型0 码力 | 41 页 | 3.20 MB | 1 年前3
涂小刚-基于k8s的微服务实践(eureka) config-server admin-server portal-server nginx-lb-ha nginx-lb-ha k8s应用对接阿波罗 提供配置获取、管理接口 配置管理界面 vip appid qx-user-web pod-name namespace TEST DEV k8s应用 容器平台日志解决方案 node-local-path 通过docker接 口获监控信息 cadvisor为kubelet内 置监 控组件,对外暴 露数据接口 k8s heapster pull拉取 cadvisor和k8sapi接口 获取监控信息写入 influxdb influxdb存储时 序数据 普罗米休斯pull拉 取cadvisor接口和 k8sapi接口获取监 控信息写入存储 通过grafna连接不 同的数据源展示不 同的监控界面 方案10 码力 | 19 页 | 1.34 MB | 1 年前3
开课吧基于混合云的Kubernetes平台落地实践-程亮prod-nacos 同步 nacos-hk kmos-eureka 同步 同步 WEB接口 API接口 Business业务层 集群A 集群B 获取服务列表 注册服务 获取服务列表 注册服务 Feign Feign 负载均衡 Ribbon 服务限流熔断 Hystrix API接口服务 WEB接口 Business业务层 扫 码 关 注 云 原 生 社 区 谢谢0 码力 | 22 页 | 7.42 MB | 9 月前3
Chaos Mesh让应用与混沌在 Kubernetes 上共舞-杨可奥Kubernetes 上运行,被测对象也运行在 Kubernetes 上 ● 测试的最小单元是 Pod 或 Container ● 使用 Helm 一键部署 友善的接口 ● 实验是作为 Kubernetes Custom Resource 管理的 友善的接口 强大的工具箱 ● PodChaos: kill / fail / ... ● NetworkChaos: delay / lose / dup /0 码力 | 30 页 | 1.49 MB | 9 月前3
云计算白皮书来源:中国信息通信研究院 图 7 应用现代化架构图 架构层面,一云多芯既可以贴合多元算力新需求,又能够支撑 业务场景多形态。一云多芯作为云计算的全新技术架构,通常指用 一套云操作系统来管理不同类型芯片、架构、接口、技术栈等硬件 服务器集群。在如今算力需求爆炸的 AI 时代,一云多芯为各行各业 践行数字化转型提供了有力支持。一方面,它可以提供统一管理、 云计算白皮书(2023 年) 17 灵活便捷的 户诉求,智算、超算等异构资源需求高涨,如何实现广泛、高效地 泛在异构资源调用,成为算力服务演进道路上亟需解决的新问题。 在此发展趋势下,产业依托云计算技术加快发展算力并网,通过引 入区块链等技术,开发统一规范化的资源接口,实现对于跨地域、 跨服务商、跨层级的算力资源的全局纳管与感知接入,打破资源提 供商之间的壁垒,形成算力资源一张网,有效促进算力资源的流动。 路由转发方面,云计算打破网络与应用的边界,支撑可编程网0 码力 | 47 页 | 1.22 MB | 1 年前3
Serverless Kubernetes - 理想,现实和未来-张维持平的计算性能:ECI计算效能需要和同规格ECS有一致的性能表现 • 更低的迁移成本:与现有容器应用生态完美集成 • 更低的使用成本:全自动化安全和运维能力 ECI关键技术选择 - 基于 Pod 的基本调度单位和标准、开放的API接口 ECI ASK ACK 云上k8s集群 线下k8s集群 Creae/Delete/Update/Describe/Logs/Exec/Metrics ECI关键技术选择 - 基于安全沙箱技术的容器运行时0 码力 | 20 页 | 2.27 MB | 1 年前3
共 15 条
- 1
- 2













