读写分离版本 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

从推荐模型的基础特点看  袁镱腾讯个⼈简介 � ⽆量系统 � 项⽬于17年启动，先后经过了6个主要版本的迭代 � 覆盖腾讯PCG全部业务的推荐场景，⽀持腾讯 IEG，CSIG，QQ⾳乐，阅⽂等业务的部分推荐场景 � 袁镱博⼠，专家⼯程师 � 研究⽅向：机器学习系统，云计算，⼤数据系统 � 负责腾讯平台与内容事业群（PCG）技术中台核⼼引擎：⽆量系统。⽀持⼤规模稀疏模型训练，推理服务—分布式Serving架构 � 读写架构 � 多线程⽆锁：基于模型版本的读写分离 � 多机：多副本并⾏读取 � CPU：固定64位key，基于L1缓存的查询优化 � 业务需求 � 模型⼤⼩超TB � 单个请求需要15W个key � 耗时要求10ms以下 � 资讯业务请求量⼤（>10000请求/秒） � 模型有多个版本 � 原有在线分布式存储系统的问题 � � 主备模式资源严重浪费 � 数据读写需要加锁 � ⽀持多模型和模型多版本困难 >15亿key/秒近千台只读版本写版本 CPU型服务 Feature 2.2 Hotkey缓存优化 <10台内存型服务并发查询优化数⼗台⽹络型服务 TB级模型实时上线 � 问题：TB模型实时多地传输和加载成本⾼ � ⽅案：⾼低频分别上线 � 更灵活的⽤法：模型多切⽚，按需上线

0 码力 | 22 页 | 6.76 MB | 1 年前
3
动手学深度学习 v2.0

. 70 2.5.2 非标量变量的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.3 分离计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.4 Python控制流的梯度计算 4.2 带参数的层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 5.5 读写文件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 5 这本书将从头开始教授深度学习的概念。有时，我们想深入研究模型的细节，这些的细节通常会被深度学习框架的高级抽象隐藏起来。特别是在基础教程中，我们希望读者了解在给定层或优化器中发生的一切。在这些情况下，我们通常会提供两个版本的示例：一个是我们从零开始实现一切，仅依赖张量操作和自动微分；另一个是更实际的示例，我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如何工作的，我们就可以在随后的教程中使用高级API了。

0 码力 | 797 页 | 29.45 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

NVIDIA GPU 和 Google TPU 等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本；自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡，图 1.12 例举了从合其它类型的神经网络的应用。Caffe 的主要开发语言是 C++，也提供 Python 语言等接口，支持 GPU 和 CPU。由于开发时间较早，在业界的知名度较高，2017 年 Facebook 推出了 Caffe 的升级版本 Cafffe2，Caffe2 目前已经融入到 PyTorch 库中。 ❑ Torch 是一个非常优秀的科学计算库，基于较冷门的编程语言 Lua 开发。Torch 灵活性较高，容易实现自定义网络层，这也是年发布的深度学习框架，最初版本只支持符号式编程。得益于发布时间较早，以及 Google 在深度学习领域的影响力，TensorFlow 很快成为最流行的深度学习框架。但是由于 TensorFlow 接口设计频繁变动，功能设计重复冗余，符号式编程开发和调试非常困难等问题，TensorFlow 1.x 版本一度被业界诟病。2019 年，Google 推出 TensorFlow 2 正式版本，将以动态图优先模式运行，从而能够避免

0 码力 | 439 页 | 29.91 MB | 1 年前
3
Keras: 基于 Python 的深度学习库

© 2018 by Keras-Team 前言整理 Keras: 基于 Python 的深度学习库 PDF 版的主要原因在于学习 Keras 深度学习库时方便本地查阅，下载最新 PDF 版本请访问: https://github.com/wanzhenchn/keras-docs-zh。感谢 keras-team 所做的中文翻译工作，本文档制作基于此处。严正声明：本文档可免费用化，可扩展性）。 • 同时支持卷积神经网络和循环神经网络，以及两者的组合。 • 在 CPU 和 GPU 上无缝运行。查看文档，请访问 Keras.io。 Keras 兼容的 Python 版本: Python 2.7-3.6。 1.2 指导原则 • 用户友好。Keras 是为人类而不是为机器设计的 API。它把用户体验放在首要和中心位置。 Keras 遵循减少认知困难的最佳实践：它提供一致且简单的 Keras (κέρας) 在希腊语中意为号角。它来自古希腊和拉丁文学中的一个文学形象，首先出现于《奥德赛》中，梦神 (Oneiroi, singular Oneiros) 从这两类人中分离出来：那些用虚幻的景象欺骗人类，通过象牙之门抵达地球之人，以及那些宣告未来即将到来，通过号角之门抵达之人。它类似于文字寓意，κέρας (号角) / κραίνω (履行)，以及 ἐλέφας

0 码力 | 257 页 | 1.19 MB | 1 年前
3
机器学习课程-温州大学-01机器学习-引言

com/p/59027692 3. 机器学习的背景知识-Python基础 51 Python 的环境的安装 ⚫Anaconda https://www.anaconda.com/distribution/ 通常选3.7版本，64位可以用默认安装，右图两个选择框都勾上 52 Python 的环境的安装 ⚫Jupyter notebook 在cmd环境下，切换到代码的目录，输入命令： jupyter notebook之后就可以索引作为右键. 66 Python模块-Pandas ⚫数据融合 pd.concat([df1, df2]) 轴向连接多个 DataFrame. 67 Python模块-Pandas 文件读写从文件中读取数据（DataFrame） pd.read_csv() | 从CSV文件读取 pd.read_table() | 从制表符分隔文件读取，如TSV pd.read_excel()

0 码力 | 78 页 | 3.69 MB | 1 年前
3
机器学习课程-温州大学-09深度学习-目标检测

类别信息和位置信息。分割（Segmentation）分割包括语义分割（semantic segmentation）和实例分割（ instance segmentation），前者是对前背景分离的拓展，要求分离开具有不同语义的图像部分，而后者是检测任务的拓展，要求描述出目标的轮廓（相比检测框更为精细）。 5 目标检测和识别 • 怎样检测和识别图像中物体，如汽车、牛等？ 1.目标检测概述

0 码力 | 43 页 | 4.12 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

训练模型理解上文或给定条件，从概率层面推测最符合要求的输出结果。其本质是借助超大规模的训练参数猜测上下文的过程文本风格主流思路是分离文本属性及文本内容迁移隐式方法即使用某类无监督学习学习或强化学习模式将文本属性及内容自动分离，常见的有生成对抗方式，即通过GAN实现目标属性和文本量性完全由不同的编码控制的状态。对话式文本生成适用于智能客服等任务型和闲聊型机器人等

0 码力 | 44 页 | 2.36 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

模型计算：传入转换后的特征数据，调用模型计算引擎在线预估服务 • 特征编码方式  通过明文hash的方式编码  适用于特征的动态增长  不需要预分配，提高处理效率 • 框架与实现分离  提供op形式的特征抽取类  逻辑一致性：在线、近线、离线特征抽取框架目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标  MLX平台架构

0 码力 | 41 页 | 5.96 MB | 1 年前
3
机器学习课程-温州大学-09机器学习-支持向量机

0-1 损失函数，可以认为它是二类分类问题的真正的损失函数，而合页损失函数是0-1损失函数的上界。 19 3.线性支持向量机求解原始最优化问题的解?∗和?∗，得到线性支持向量机，其分离超平面为 ?∗T? + ?∗ = 0 分类决策函数为：?(?) = sign ?∗T? + ?∗ 线性可分支持向量机的解?∗唯一，但?∗不唯一。对偶问题是 min ? 1 2 ෍ ?=1

0 码力 | 29 页 | 1.51 MB | 1 年前
3
机器学习课程-温州大学-特征工程

Analysis，独立成分分析) ICA独立成分分析，获得的是相互独立的属性。ICA算法本质寻找一个线性变换 ? = ??，使得 ? 的各个特征分量之间的独立性最大。 PCA 对数据进行降维 ICA 来从多个维度分离出有用数据步骤 PCA 是 ICA 的数据预处理方法降维 3. 特征提取 20 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J].统计研究,2019,36(01) 1

0 码力 | 38 页 | 1.28 MB | 1 年前
3

共 26 条前往

页

分类

语言

格式