动手学深度学习 v2.0参数服务器的核心思想首先是由 (Smola and Narayanamurthy, 2010)在分布式隐变量模型的背景下引入的。 然后,在 (Ahmed et al., 2012)中描述了Push和Pull的语义,又在 (Li et al., 2014)中描述了系统和开源库。下 面,我们将介绍用于提高计算效率的组件。 12.7.1 数据并行训练 让我们回顾一下在分布式架构中数据并行的训练方法, 这就允许我们定义下面两个操作:push(用于累积梯度)和pull(用于取得聚合梯度)。因为我们有很多层,也 就有很多不同的梯度集合,因此需要用一个键i来对梯度建索引。这个与Dynamo (DeCandia et al., 2007)中引 入的键-值存储之间存在相似性并非巧合。它们两个定义都拥有许多相似的性质,特别是在多个服务器之间 分发参数时。 键-值存储的push与pull操作描述如下: 12.7. 参数服务器 push(key,value)将特定的梯度值从工作节点发送到公共存储,在那里通过某种方式(例如,相加) 来聚合值; • pull(key,value)从公共存储中取得某种方式(例如,组合来自所有工作节点的梯度)的聚合值。 通过将同步的所有复杂性隐藏在一个简单的push和pull操作背后,我们可以将统计建模人员(他们希望能够 用简单的术语表达优化)和系统工程师(他们需要处理分布式同步中固有的复杂性)的关注点解耦。0 码力 | 797 页 | 29.45 MB | 1 年前3
Keras: 基于 Python 的深度学习库. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 21 贡献 242 21.1 关于 Github Issues 和 Pull Requests . . . . . . . . . . . . . . . . . . . . . . . . . . 242 21.2 漏洞报告 . . . . . . . . . . . 21.4 请求贡献代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 21.5 Pull Requests 合并请求 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 21.6 添加新的样例 或.save_weights(fname) 以进行存储,而不是通过 multi_gpu_model 返回的模型。 贡献 242 21 贡献 21.1 关于 Github Issues 和 Pull Requests 找到一个漏洞?有一个新的功能建议?想要对代码库做出贡献?请务必先阅读这些。 21.2 漏洞报告 你的代码不起作用,你确定问题在于 Keras?请按照以下步骤报告错误。 10 码力 | 257 页 | 1.19 MB | 1 年前3
《TensorFlow 快速入门与实战》2-TensorFlow初接触ocker-ce-desktop-mac 1. Install Docker for Mac 2. Run Docker for Mac 3. Pull a TensorFlow Docker image $ docker pull tensorflow/tensorflow:nightly-jupyter 4. Start a TensorFlow Docker container0 码力 | 20 页 | 15.87 MB | 1 年前3
PyTorch Release NotesPyTorch RN-08516-001_v23.07 | 2 Chapter 2. Pulling A Container About this task Before you can pull a container from the NGC container registry: ‣ Install Docker. ‣ For NVIDIA DGX™ users, see Preparing following command assumes that you want to pull the latest container. docker pull nvcr.io/nvidia/pytorch:23.07-py3 2. Open a command prompt and paste the pull command. Running PyTorch PyTorch RN-08516-001_v23 RN-08516-001_v23.07 | 4 Ensure that the pull successfully completes before you proceed to step 3. 3. To run the container image, select one of the following modes: ‣ Interactive ‣ If you have Docker0 码力 | 365 页 | 2.94 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波• 冷备容灾:基于checkpoint机制(Local模式&Remote模式),实现参数服务的高可用,支持基于模型的异构集群迁移,支持集 群扩缩容 • 性能优化 • 通信优化:数据请求(PULL&PUSH)聚合,同模型多矩阵并发,锁粒度优化,性能提升5-10倍 • 缓存优化:使用堆外内存与LRU过期机制,解决GC引起的性能损耗,性能提升3-5倍 • 分区优化:支持多种分区策略(RAN0 码力 | 36 页 | 16.69 MB | 1 年前3
超大规模深度学习在美团的应用-余建平64分片整体可用性:99.99% ^ 64 = 99.36% 128分片整体可用性:99.99% ^ 128 = 98.72% • Backup Request Jeff Dean在解决BigTable高扇出时提出的方案 PS的长尾效应 Backup Request 副本1 副本2 PS Shard 1 副本1 副本2 PS Shard 2 副本1 副本2 PS Shard N Predictor Predictor req 1 req 2 req N PS Req … … reply 1 reply 2 reply N … 超过t Backup Request Cancel Request 流式模型的通路 • 持久化存储 本地disk存储,持久化对齐kafka的数据 • PS快速failover Compaction机制,降低load数据量 • Online Learning对数据流的要求0 码力 | 41 页 | 5.96 MB | 1 年前3
《Efficient Deep Learning Book》[EDL] Chapter 3 - Learning Techniquesimport ImageDataGenerator from urllib.request import urlopen IMG_SIZE = 224 def load_image(url): with urlopen(url) as request: img_array = np.asarray(bytearray(request.read()), dtype=np.uint8) img = cv20 码力 | 56 页 | 18.93 MB | 1 年前3
Chatbots 中对话式交互系统的分析与应用语言理解 (SLU) 策略优化 (DPO) 状态追踪 (DST) inform(order_op=预订, restaurant_name=云海肴, subbranch=中关村店) request(phone, name) 理解模块 对话管理 模块 产生模块 Spoken Language Understanding (SLU) • 结构化表示自然语言的语义: • act1 (slot1=value1 slot2=value2,…), act2 (slot1=value1,…), … • acttype, slot, value的取值范围已预先定义好 “您好韩小姐,麻烦提供下手机号哦” request (phone, name=韩小姐) act slot slot value act-slot-value tuples 语言理解 (SLU) • DSTC3中定义的部分动作类别 语言理解0 码力 | 39 页 | 2.24 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱Worker 返回参数 Request Handler Parameter Server 查询Sparse Table 查询Dense Tensor 更新参数 � 常规训练流⽔线 样本读取 样本解析 参数拉取 参数更新 查询Sparse Table 查询Dense Tensor Reader Learner Worker 返回参数 Request Handler Parameter0 码力 | 22 页 | 6.76 MB | 1 年前3
PyTorch Tutorialtorch • ???????????? On Princeton CS server (ssh cycles.cs.princeton.edu) • Non-CS students can request a class account. • Miniconda is highly recommended, because: • It lets you manage your own Python0 码力 | 38 页 | 4.09 MB | 1 年前3
共 12 条
- 1
- 2













