OpenShift Container Platform 4.13 CI/CDsource-to-image 增量 增量构 构建 建 Source-to-image (S2I) 可以执行增量构建,也就是能够重复利用过去构建的镜像中的工件。 流程 流程 要创建增量构建,请创建对策略定义进行以下修改: 指定支持增量构建的镜像。请参考构建器镜像的文档,以确定它是否支持此行为。 此标志(flag)控制是否尝试增量构建。如果构建器镜像不支持增量构建,则构建仍将成 功,但您会收到一条日志消息,指出增量构建因为缺少 功,但您会收到一条日志消息,指出增量构建因为缺少 save-artifacts 脚本而未能成功。 其他 其他资 资源 源 如需有关如何创建支持增量构建的构建器镜像的信息,请参阅 S2I 要求。 2.5.2.2. 覆盖 覆盖 source-to-image 构 构建器 建器镜 镜像脚本 像脚本 您可以覆盖构建器镜像提供的 assemble、run 和 save-artifacts source-to-image(S2I)脚本。 描述 描述 assemble assemble 用来从源代码构建应用程序工件,并将其放置在镜像内部的适当目录 中的脚本。这个脚本是必需的。此脚本的工作流为: 1. 可选:恢复构建工件。如果要支持增量构建,确保同时定义了 save- artifacts。 2. 将应用程序源放在所需的位置。 3. 构建应用程序工件。 4. 将工件安装到适合它们运行的位置。 run run 脚本将执行您的应用程序。这个脚本是必需的。0 码力 | 129 页 | 1.37 MB | 1 年前3
OpenShift Container Platform 4.4 构建(build)Source-to-Image (S2I) 增量构建 S2I 可以执行增量构建,也就是能够重复利用过去构建的镜像中的工件。 流程 流程 要创建增量构建,请创建 BuildConfig 并对策略定义进行以下修改: 指定支持增量构建的镜像。请参考构建器镜像的文档,以确定它是否支持此行为。 此标志(flag)控制是否尝试增量构建。如果构建器镜像不支持增量构建,则构建仍将成功,但您会 收到一条日志消息,指出增量构建因为缺少 save-artifacts save-artifacts 脚本而未能成功。 其他 其他资 资源 源 如需有关如何创建支持增量构建的构建器镜像的信息,请参阅 S2I 要求。 5.2.2. 覆盖 Source-to-Image (S2I) 构建器镜像脚本 您可以覆盖构建器镜像提供的 assemble、run 和 save-artifacts S2I 脚本。 流程 流程 要覆盖构建器镜像提供的 assemble、run 脚本 脚本 脚本 描述 描述 assemble(必需) assemble 用来从源代码构建应用程序工件,并将其放置在镜像内部的适当目录 中的脚本。此脚本的工作流为: 1. 恢复构建工件。如果要支持增量构建,请确保同时定义了 save- artifacts(可选)。 2. 将应用程序源放在所需的位置。 3. 构建应用程序工件。 4. 将工件安装到适合它们运行的位置。 run(必需) run0 码力 | 101 页 | 1.12 MB | 1 年前3
Docker 从入门到实践 0.4拟机、公有云、私有云、个人电脑、服务器 等。 这种兼容性可以让用户把一个应用程序从一个平台直接迁移到另外一个。 使用 Docker,只需要小小的修改,就可以替代以往大量的更新工作。所有的修改都以增量的方式被分发和 更新,从而实现自动化并且高效的管理。 特性 容器 虚拟机 启动 秒级 分钟级 硬盘使用 一般为 MB 一般为 GB 性能 接近原生 弱于 系统支持量 单机支持上千个容器 一般几十个 2418f0 *注意:在删除镜像之前要先用 docker rm 删掉依赖于这个镜像的所有容器。 移除本地镜像 Docker —— 从入门到实践 26 移除 Docker 镜像是怎么实现增量的修改和维护的? 每个镜像都由很多层次构成,Docker 使用 Union FS 将这 些不同的层结合到一个镜像中去。 通常 Union FS 有两个用途, 一方面可以实现不借助 LVM、RAID attach nostalgic_hypatia root@243c32535da7:/# 但是使用 attach 命令有时候并不方便。当多个窗口同时 attach 到同一个容器的时候,所有窗口都会同步 显示。当某个窗口因命令阻塞时,其他窗口也无法执行操作了。 nsenter 工具在 util-linux 包2.23版本后包含。 如果系统中 util-linux 包没有该命令,可以按照下面的方法0 码力 | 179 页 | 2.27 MB | 1 年前3
Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践Compliance 访问控制、审计、安全链接、加密存储等等。 Patching & Upgrades 小版本升级、大版本升级、安全漏洞修复等等。 Data Migrations 迁移、同步、清洗、跨地域、灾备、多活等等。 DB Operator Day-2 Operations Operator 基础模型 第二部分 K8s 架构 Cache Informer 机制 Cache 获取 API Server 中数据的一份快照,并记 录 ResourceVersion 版本信息,watch 从 ResourceVersion 开始,获取后 续的增量数据。 watch 通过网络异步(asynchronous)获取增量数据,所以 cache 提供 的是最终一致性(eventual consistency)。 期间遇到网络、API Server 报错等异常时,会有重试机制 Controller-runtime 种可能的动作,即 Create、Update 和 Delete。 进一步的,stale 对象意味着本地 cache 落后于 API Server 中对象若干版本,也就是说有一段增量更新还没有 复制过来,那么这段增量可以用一个 c/u/d (即 create/update/delete)排列组合来表达。 形式化的,将“+”运算定义为集合 {c, u, d} 上的一个二 元运算,其目的是将连续两个操作转化成一个操作,可以0 码力 | 21 页 | 3.06 MB | 9 月前3
阿里云上深度学习建模实践-程孟力Conflict] 特征准入/淘汰 Adaptive Embedding 训练: 推理: Ring All-reduc同步训练 [HybridBackend/SOK] 特征选择 [VariationalDropout] 通信优化 [GRPC++] 实时训练 [增量更新] 混合精度 [bf16] 工程优化: 千亿特征优化 模型蒸馏 AVX/SSE优化 Graph优化 [User Sequence Feature [side info] Op Fusion [hash + embedding] Overlap Execution [FG OP化] Item Feature增量更新 3.工程优化复 杂 4.数据获取困 难 挑战 深度模型是非线性的: • 参数很多 • 参数敏感 • 不同场景的数据上差异大 从FM到DeepFM rt 增 加了10倍怎么优化?0 码力 | 40 页 | 8.51 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波数据规模越大,效果越好 • 月级数据规模相比周级数据模型,效果相差5+% • 在线和离线模型效果对比 • 在线FM相比于离线FM,相关指标提升5+% • 完全在线初始化模型参数 • 增量在线FM相比于离线FM,相关指标提升8+% • 增量在线FM:即依托于离线模型初始化在线FM模型参数 3 在线机器学习-效果 • 深度化 • 特征深度化:特征embedding • 模型深度化:深度学习模型, Wide&Deep;DeepFM Tensorflow 4 深度学习-深度学习模型训练 • 通信优化 • PS:BSP/SSP/ASP多种通信模式支持 • MPI&RingAllreduce:Horovod,使用 MPI替换grpc,同步通信模式;带宽优化,增加延时; • PS&MPI:DistributionStrategy API,统一分布式语义,解耦分布式架构与模型训练框架 • 使用FP16通信,使用FP32做计算,带宽压力降低一倍0 码力 | 36 页 | 16.69 MB | 1 年前3
Hadoop 迁移到阿里云MaxCompute 技术方案................................................. 50 7.1.8 运行 hive_udtf_sql_runner.py,将 hive 的数据同步到 odps ........................................ 51 7.2 进阶功能..................................... 统一的命令行工具和 JAVA/PYTHON SDK 开发&诊断 Dataworks/Studio/Logview 配套的数据同步、作业开发、工作流编排调度、作业运维 及诊断工具。开源社区常见的 Sqoop、Kettle、Ozzie 等 实现数据同步和调度。 整体 不是孤立的功能,完整的企 业服务 不需要多组件集成、调优、定制,开箱即用。 3 MaxCompute 迁移场景分析 于规模较大的用户,建 议您选择部分试点业务先行进行迁移验证,待迁移验证通过后,再扩展更大的业务范围以降低迁 移风险、提高迁移质量。 5.3 阶段 3:并行测试,割接 迁移完成后,建议基于增量数据与当前系统进行并行测试,待并行一段时间后,对并行测试 结果进行对比验证,符合业务预期即可将业务全部切换至 MaxCompute 平台。 对于规模较小的系统迁移,一般迁移上线周期不超过 2 周。但更多的情况下,我们建议您0 码力 | 59 页 | 4.33 MB | 1 年前3
采用开源Harbor Registry实现高效安全的容器镜像运维• 设置内容信任 镜像复制 22 Project Images Policy Image Project Images 初始复制 Image 增量复制 (含镜像删除复制) 复制策略管理 用二进制格式确保镜像一致性 24 Dev Registry CI Git Test Registry images images images images Staging Registry images images Production Registry images 不不同环境中的镜像同步使⽤用Harbor registry来实现 复制技术在镜像分发中应用 25 Master – Slave 模式 Docker Client push Docker host0 码力 | 29 页 | 3.97 MB | 1 年前3
高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰获取滑动窗 口当前 Committed Index 序 号 • 根据当前序号进行快照读 • Range 后 Client 通过 Watch 从leader RingBuffer 中获取 增量事件,达到 最终一致性 逻辑层 – 选主 逻辑层 – TSO 接入层 接入层 客户端 客户端 K8s 元信息存储的需求 • 背景介绍 • 设计思路 • 性能优化 • 落地效果 Stream 代替分页,降低延迟 内存高效复用,避免 OOM 读优化 - 2 多分片并发读 通过并发,大大减少读时延 读优化 - 3 读写分离 follower 可以无限扩展,没有 raft 同步问题 读写之间无相互影响 读优化 - 4 Count 优化 基于周期性 Compact 统计,存在内存 降低时延,减轻存储压力 Watch 优化 - 1 写性能提升带来直接收益 写延迟降低,watch0 码力 | 60 页 | 8.02 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱新增:GPU并⾏操作友好->CSR格式的显存数据访问 SSD磁盘 10TB 全部参数 内存 1TB 即将⽤到的参数 显存 32/40/80GB 正在训练的参数 分布式训练的慢机与同步问题 � Feature 2.1: 短时间内只有部分item和user被命中, 只有部分参数被⽤到 � GPU训练的优势 � 更少的机器节点,更少的分布式系统相关问题 � 更⾼的性价⽐ 1 Group 1 Group N 副本1 副本2 推理节点 SDK MB级别DNN部分 Sparse Hotkey TB级别Embedding部分 全量模型,TB级,低峰期(Cos存储) 增量模型,GB级,20分钟(Cos存储) 实时模型,KB级,秒(Kafka) 分布式 Serving集群 推理节点 分布式 Serving集群 推理节点 召回索引服务 业务服务 1. 获取⽤户向量0 码力 | 22 页 | 6.76 MB | 1 年前3
共 118 条
- 1
- 2
- 3
- 4
- 5
- 6
- 12













