从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱从推荐模型的基础特点看 袁镱 腾讯 个⼈简介 � ⽆量系统 � 项⽬于17年启动,先后经过了6个主要版本的 迭代 � 覆盖腾讯PCG全部业务的推荐场景,⽀持腾讯 IEG,CSIG,QQ⾳乐,阅⽂等业务的部分推 荐场景 � 袁镱 博⼠,专家⼯程师 � 研究⽅向:机器学习系统,云计算,⼤数据系统 � 负责腾讯平台与内容事业群(PCG)技术中台核 ⼼引擎:⽆量系统。⽀持⼤规模稀疏模型训练, 推理服务—分布式Serving架构 � 读写架构 � 多线程⽆锁:基于模型版本的读写分离 � 多机:多副本并⾏读取 � CPU:固定64位key,基于L1缓存的查 询优化 � 业务需求 � 模型⼤⼩超TB � 单个请求需要15W个key � 耗时要求10ms以下 � 资讯业务请求量⼤ (>10000请求/秒) � 模型有多个版本 � 原有在线分布式存储系统的 问题 � � 主备模式资源严重浪费 � 数据读写需要加锁 � ⽀持多模型和模型多版本 困难 >15亿key/秒 近千台 只读版本 写版本 CPU型服务 Feature 2.2 Hotkey缓存优化 <10台 内存型服务 并发查询优化 数⼗台 ⽹络型服务 TB级模型实时上线 � 问题:TB模型实时多地传输和加载成本⾼ � ⽅案:⾼低频分别上线 � 更灵活的⽤法:模型多切⽚,按需上线0 码力 | 22 页 | 6.76 MB | 1 年前3
动手学深度学习 v2.0. 70 2.5.2 非标量变量的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.3 分离计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.4 Python控制流的梯度计算 4.2 带参数的层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 5.5 读写文件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 5 这本书将从头开始教授深度学习的概念。有时,我们想深入研究模型的细节,这些的细节通常会被深度学习 框架的高级抽象隐藏起来。特别是在基础教程中,我们希望读者了解在给定层或优化器中发生的一切。在这 些情况下,我们通常会提供两个版本的示例:一个是我们从零开始实现一切,仅依赖张量操作和自动微分; 另一个是更实际的示例,我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如 何工作的,我们就可以在随后的教程中使用高级API了。0 码力 | 797 页 | 29.45 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112NVIDIA GPU 和 Google TPU 等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从 零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本;自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。 目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡, 图 1.12 例举了从 合其它类型的神经网络的应用。Caffe 的主要开发语言是 C++,也提供 Python 语言等 接口,支持 GPU 和 CPU。由于开发时间较早,在业界的知名度较高,2017 年 Facebook 推出了 Caffe 的升级版本 Cafffe2,Caffe2 目前已经融入到 PyTorch 库中。 ❑ Torch 是一个非常优秀的科学计算库,基于较冷门的编程语言 Lua 开发。Torch 灵活性 较高,容易实现自定义网络层,这也是 年发布的深度学习框架,最初版本只支持符号式编程。 得益于发布时间较早,以及 Google 在深度学习领域的影响力,TensorFlow 很快成为最 流行的深度学习框架。但是由于 TensorFlow 接口设计频繁变动,功能设计重复冗余, 符号式编程开发和调试非常困难等问题,TensorFlow 1.x 版本一度被业界诟病。2019 年,Google 推出 TensorFlow 2 正式版本,将以动态图优先模式运行,从而能够避免0 码力 | 439 页 | 29.91 MB | 1 年前3
Keras: 基于 Python 的深度学习库© 2018 by Keras-Team 前 言 整理 Keras: 基于 Python 的深度学习库 PDF 版的主要原因在于学习 Keras 深度学习库时方 便本地查阅,下载最新 PDF 版本请访问: https://github.com/wanzhenchn/keras-docs-zh。 感谢 keras-team 所做的中文翻译工作,本文档制作基于此处。 严正声明:本文档可免费用 化,可扩展性)。 • 同时支持卷积神经网络和循环神经网络,以及两者的组合。 • 在 CPU 和 GPU 上无缝运行。 查看文档,请访问 Keras.io。 Keras 兼容的 Python 版本: Python 2.7-3.6。 1.2 指导原则 • 用户友好。Keras 是为人类而不是为机器设计的 API。它把用户体验放在首要和中心位置。 Keras 遵循减少认知困难的最佳实践:它提供一致且简单的 Keras (κέρας) 在希腊语中意为 号角。它来自古希腊和拉丁文学中的一个文学形象,首先出 现于 《奥德赛》中,梦神 (Oneiroi, singular Oneiros) 从这两类人中分离出来:那些用虚幻的景象 欺骗人类,通过象牙之门抵达地球之人,以及那些宣告未来即将到来,通过号角之门抵达之人。 它类似于文字寓意,κέρας (号角) / κραίνω (履行),以及 ἐλέφας0 码力 | 257 页 | 1.19 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言com/p/59027692 3. 机器学习的背景知识-Python基础 51 Python 的环境的安装 ⚫Anaconda https://www.anaconda.com/distribution/ 通常选3.7版本,64位 可以用默认安装,右图两个选择框都勾上 52 Python 的环境的安装 ⚫Jupyter notebook 在cmd环境下,切换到代码的 目录,输入命令: jupyter notebook之后就可以 索引作为右键. 66 Python模块-Pandas ⚫数据融合 pd.concat([df1, df2]) 轴向连接多个 DataFrame. 67 Python模块-Pandas 文件读写 从文件中读取数据(DataFrame) pd.read_csv() | 从CSV文件读取 pd.read_table() | 从制表符分隔文件读取,如TSV pd.read_excel()0 码力 | 78 页 | 3.69 MB | 1 年前3
机器学习课程-温州大学-09深度学习-目标检测类别信息和位置信息。 分割(Segmentation) 分割包括语义分割(semantic segmentation)和实例分割( instance segmentation),前者 是对前背景分离的拓展,要求 分离开具有不同语义的图像部 分,而后者是检测任务的拓展 ,要求描述出目标的轮廓(相 比检测框更为精细)。 5 目标检测和识别 • 怎样检测和识别图 像中物体,如汽车、 牛等? 1.目标检测概述0 码力 | 43 页 | 4.12 MB | 1 年前3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入训练模型理解上文或给定条件,从概率层 面推测最符合要求的输出结果。其本质是 借助超大规模的训练参数猜测上下文的过 程 文本风格 主流思路是分离文本属性及文本内容 迁移 隐式方法即使用某类无监督学习学习或强化学 习模式将文本属性及内容自动分离,常见的有 生成对抗方式,即通过GAN实现目标属性和 文本量性完全由不同的编码控制的状态。 对话式文本生成适用于智能客服等任务型和闲聊型机器人等0 码力 | 44 页 | 2.36 MB | 1 年前3
超大规模深度学习在美团的应用-余建平模型计算: 传入转换后的特征数据,调用模型计算引擎 在线预估服务 • 特征编码方式 通过明文hash的方式编码 适用于特征的动态增长 不需要预分配,提高处理效率 • 框架与实现分离 提供op形式的特征抽取类 逻辑一致性:在线、近线、离线 特征抽取框架 目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX MLX平台目标 MLX平台架构0 码力 | 41 页 | 5.96 MB | 1 年前3
机器学习课程-温州大学-09机器学习-支持向量机0-1 损失函数,可以认为它是二类分类问题的真 正的损失函数,而合页损失函数是0-1损失函 数的上界。 19 3.线性支持向量机 求解原始最优化问题的解?∗和?∗,得到线性支持向量机,其分离超平面为 ?∗T? + ?∗ = 0 分类决策函数为:?(?) = sign ?∗T? + ?∗ 线性可分支持向量机的解?∗唯一,但?∗不唯一。对偶问题是 min ? 1 2 ?=10 码力 | 29 页 | 1.51 MB | 1 年前3
机器学习课程-温州大学-特征工程Analysis,独立成分分析) ICA独立成分分析,获得的是相互独立的属性。ICA算法本质寻找一 个线性变换 ? = ??,使得 ? 的各个特征分量之间的独立性最大。 PCA 对数据 进行降维 ICA 来从多 个维度分离 出有用数据 步骤 PCA 是 ICA 的数据预处理方法 降维 3. 特征提取 20 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J].统计研究,2019,36(01) 10 码力 | 38 页 | 1.28 MB | 1 年前3
共 26 条
- 1
- 2
- 3













