 Kubernetes for Edge Computing across
Inter-Continental Haier Production Sites提交多框架(TensorFlow、PyTorch 、MxNet等)的模型训练作业,支 持分布式和 GPU 加速,以及训练过 程的可视化。 模型训练 模型版本管理,模型推理服务的部署 、监控、管理和升级,提供 A/B test 和滚动升级。 模型服务 实现对 GPU 集群资源进行管理,根 据用户作业请求自动分配和回收 GPU 资源。 GPU 集群管理 对接存储系统,管理数据集;提供 对接存储系统,管理数据集;提供 notebook 交互式代码开发和调试工 具;管理数据预处理批作业。 模型开发 海尔工业互联网 – 才云数据解决方案 海尔工业互联网 – 才云数据解决方案 海尔工业互联网 – 才云数据解决方案 海尔工业互联网 – 才云数据解决方案 边缘计算场景 1. 海尔在全球有许多工厂 2. 工厂里的机器不多 3. 这些机器上跑了一些容器服务 4. 因为机器数量不多,不希望每个工厂组成一个0 码力 | 33 页 | 4.41 MB | 1 年前3 Kubernetes for Edge Computing across
Inter-Continental Haier Production Sites提交多框架(TensorFlow、PyTorch 、MxNet等)的模型训练作业,支 持分布式和 GPU 加速,以及训练过 程的可视化。 模型训练 模型版本管理,模型推理服务的部署 、监控、管理和升级,提供 A/B test 和滚动升级。 模型服务 实现对 GPU 集群资源进行管理,根 据用户作业请求自动分配和回收 GPU 资源。 GPU 集群管理 对接存储系统,管理数据集;提供 对接存储系统,管理数据集;提供 notebook 交互式代码开发和调试工 具;管理数据预处理批作业。 模型开发 海尔工业互联网 – 才云数据解决方案 海尔工业互联网 – 才云数据解决方案 海尔工业互联网 – 才云数据解决方案 海尔工业互联网 – 才云数据解决方案 边缘计算场景 1. 海尔在全球有许多工厂 2. 工厂里的机器不多 3. 这些机器上跑了一些容器服务 4. 因为机器数量不多,不希望每个工厂组成一个0 码力 | 33 页 | 4.41 MB | 1 年前3
 k8s操作手册 2.3#cronjob的标签 spec: schedule: "*/2 * * * *" #分时日月周 concurrencyPolicy: Allow #前一次作业未完成时,下一次作业是否允许运行/ 如何运行 # Allow允许下一次作业运行,Forbid禁止,Replace替换 failedJobsHistoryLimit: 1 #失败的任务 历史记录数,默认1 success0 码力 | 126 页 | 4.33 MB | 1 年前3 k8s操作手册 2.3#cronjob的标签 spec: schedule: "*/2 * * * *" #分时日月周 concurrencyPolicy: Allow #前一次作业未完成时,下一次作业是否允许运行/ 如何运行 # Allow允许下一次作业运行,Forbid禁止,Replace替换 failedJobsHistoryLimit: 1 #失败的任务 历史记录数,默认1 success0 码力 | 126 页 | 4.33 MB | 1 年前3
 K8S安装部署开放服务centos lvdisplay mkfs.xfs -n ftype=1 /dev/mapper/centos-docker mkdir -p /var/lib/docker mount /dev/mapper/centos-docker /var/lib/docker echo "/dev/mapper/centos-docker /var/lib/docker xfs defaults defaults 0 0" >> /etc/fstab xfs_growfs /dev/mapper/centos-docker df –Th A2. 创建 k8s-node1, k8s-node2, k8s-node3 内存:16GB, 系统盘:40GB,docker 数据盘:40GB,ceph 数据盘:200GB 【注】所有节点(k8s-master, k8s-node1, k8s-node2 Step5. 关闭 swap 分区 swapoff -a && sysctl -w vm.swappiness=0 //设置 swap 开机不启动 vi /etc/fstab #/dev/mapper/centos-swap swap swap defaults 0 0 Step6. 配置 ulimt ulimit -SHn0 码力 | 54 页 | 1.23 MB | 1 年前3 K8S安装部署开放服务centos lvdisplay mkfs.xfs -n ftype=1 /dev/mapper/centos-docker mkdir -p /var/lib/docker mount /dev/mapper/centos-docker /var/lib/docker echo "/dev/mapper/centos-docker /var/lib/docker xfs defaults defaults 0 0" >> /etc/fstab xfs_growfs /dev/mapper/centos-docker df –Th A2. 创建 k8s-node1, k8s-node2, k8s-node3 内存:16GB, 系统盘:40GB,docker 数据盘:40GB,ceph 数据盘:200GB 【注】所有节点(k8s-master, k8s-node1, k8s-node2 Step5. 关闭 swap 分区 swapoff -a && sysctl -w vm.swappiness=0 //设置 swap 开机不启动 vi /etc/fstab #/dev/mapper/centos-swap swap swap defaults 0 0 Step6. 配置 ulimt ulimit -SHn0 码力 | 54 页 | 1.23 MB | 1 年前3
 第1930期:Kubernetes基础介绍自动发布和回滚:可以自动实现版本的发布和回滚。 秘钥和配置管理:对于密码等信息,专门提供了Secert对象为其解耦。 存储编排:支持多种不同类型的存储,包括本地存储、云存储、网络存储等。 批量处理执行:除服务型应用,还支持批处理作业CI(持续集成),如有需要,一样可以实现容器故障后修复。 Kubernetes特点: 可移植: 支持公有云,私有云,混合云,多重云(multi-cloud) 可扩展: 模块化, 插件化, 可挂载0 码力 | 49 页 | 4.11 MB | 1 年前3 第1930期:Kubernetes基础介绍自动发布和回滚:可以自动实现版本的发布和回滚。 秘钥和配置管理:对于密码等信息,专门提供了Secert对象为其解耦。 存储编排:支持多种不同类型的存储,包括本地存储、云存储、网络存储等。 批量处理执行:除服务型应用,还支持批处理作业CI(持续集成),如有需要,一样可以实现容器故障后修复。 Kubernetes特点: 可移植: 支持公有云,私有云,混合云,多重云(multi-cloud) 可扩展: 模块化, 插件化, 可挂载0 码力 | 49 页 | 4.11 MB | 1 年前3
 Kubernetes开源书 -  周立个Node上的多个Pod,⽽不是单个Node上的单个进程。 ReplicaSet将本地容器的重启委托给Node上的某个代理(例如,Kubelet或Docker)。 Job(作业) 对于可预期会终⽌的Pod(即批处理作业),可以使⽤ Job ⽽⾮ReplicaSet。 DaemonSet 对于提供机器级功能(例如机器监控或⽇志)的Pod,请使⽤ DaemonSet ⽽⾮ReplicaSet。0 码力 | 135 页 | 21.02 MB | 1 年前3 Kubernetes开源书 -  周立个Node上的多个Pod,⽽不是单个Node上的单个进程。 ReplicaSet将本地容器的重启委托给Node上的某个代理(例如,Kubelet或Docker)。 Job(作业) 对于可预期会终⽌的Pod(即批处理作业),可以使⽤ Job ⽽⾮ReplicaSet。 DaemonSet 对于提供机器级功能(例如机器监控或⽇志)的Pod,请使⽤ DaemonSet ⽽⾮ReplicaSet。0 码力 | 135 页 | 21.02 MB | 1 年前3
共 5 条
- 1














