新一代分布式高性能图数据库 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

动手学深度学习 v2.0

前向传播、反向传播和计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4.7.1 前向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 4.7.2 前向传播计算图 . . . 间。成熟的库应该自动化常见的任务，示例代码应该使从业者可以轻松地修改、应用和扩展常见的应用程序，以满足他们的需求。以动态网页应用为例。尽管许多公司，如亚马逊，在20世纪90年代开发了成功的数据库驱动网页应用程序。但在过去的10年里，这项技术在帮助创造性企业家方面的潜力已经得到了更大程度的发挥，部分原因是开发了功能强大、文档完整的框架。测试深度学习的潜力带来了独特的挑战，因为任何另一个是更实际的示例，我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如何工作的，我们就可以在随后的教程中使用高级API了。内容和结构全书大致可分为三个部分，在图1 中用不同的颜色呈现：目录 3 图1: 全书结构 • 第一部分包括基础知识和预备知识。1节提供深度学习的入门课程。然后在 2节中，我们将快速介绍实践深度学习所需的前提条件，例如如何存储和处理数据，以及如何应用基于线性代数、微积分和概率基

0 码力 | 797 页 | 29.45 MB | 1 年前
3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒

2015-2017 l单机、简易分布式人脸检测、跟踪、比对平台 l处理数十路到数百路监控摄像头数据 l千万级别深度学习特征检索 l行业试水 2018-2019 l云原生Cloud-Native超大规模视图存储、处理、检索 l处理数万到数十万路，城市范围级别监控、门禁摄像头数据 l10-100 Billion级别深度学习特征检索 - PB以上级别数据库存储 - 100PB级别抓拍图片存储 scheduling Go语言在高性能系统中的实践经验 • 为什么用Go - 比起C++，更易于实践各种并发模式 - 比起Java，更加简洁，更易于与C/C++交互 - 比起脚本语言，类型和内存安全，保证重构效率与产品质量 - 完善的配套工具，如go test, gofmt, go lint, race-detector Go语言在高性能系统中的实践经验 • Go在开发高性能应用上也有一些不足，构建百万以上级别的对象缓存，需要仔细优化百倍慢于等价的C实现！回顾 • 智慧城市中，在智能安防领域机器视觉有着爆发式应用 • 我们使用基于深度学习的机器视觉技术，构建了超大规模的自我演化的分布式智能系统 • 在构建这个规模的系统中，我们广泛使用了Kubernetes、Go等流行技术，“那些年踩过的坑”

0 码力 | 23 页 | 9.26 MB | 1 年前
3
谭国富：深度学习在图像审核的应用

深度学习在图像审核的应用腾讯优图实验室谭国富 http://open.youtu.qq.com SACC2017 优图团队立足于社交网络大平台，借助社交业务积累的海量人脸、图片、音乐等数据，专注在人脸、图像、音乐、语音、机器学习等领域开展技术研究，并积极推动研究成果在业务中落地产生价值。关于优图实验室人脸识别图像识别音频识别 SACC2017 目录 01 腾讯优图内容审核能力介绍业务痛点：面对越来越爆发的安全风险，解决办法门槛高，成本高；迫切需要技术解决方案 SACC2017 图像内容审核技术 OCR技术图像分割以及超分辨率技术优图图像技术还包括：图像分类、图像增强、艺术滤镜、图片去水印、图像融合、图像修补等。图像识别技术 01 腾讯优图图像技术能力 SACC2017 内容审核 - 图片鉴黄解决方案区分图像中的色情、性感和正常内容 DeepEye可给出图片属于色情、性感和正常极端主义、恐怖主义标识 SACC2017 内容识别 – 人脸识别 l 政治敏感人物识别，直播，视频等场景 Ø 上亿级别的人脸检索，秒级的检索速度从黑名单，白名单数据库中返回目标人脸信息。 Ø 技术指标：优图人脸识别通过传统方法和深度学习技术结合，以空间面孔墙和微众银行远程核身为基础，在性能上达到LFW 99.80%。 Ø QQ，微云等：非法设置领导人头像，公众人物，

0 码力 | 32 页 | 5.17 MB | 1 年前
3
《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测

扫描二维码试看/购买《TensorFlow 快速入门与实战》视频课程 • 房价预测模型介绍 • 使用 TensorFlow 实现房价预测模型 • 使用 TensorBoard 可视化模型数据流图 • 实战 TensorFlow 房价预测第四部分目录房价预测模型介绍前置知识：监督学习（Supervised Learning）监督学习是机器学习的一种方法，指从训练数据（输入和预期输出）中学到一个模型（函数），规范化创建模型 (数据流图) 创建会话 (运行环境) 训练模型数据分析库：Pandas Pandas 是一个 BSD 开源协议许可的，面向 Python 用户的高性能和易于上手的数据结构化和数据分析工具。数据框（Data Frame）是一个二维带标记的数据结构，每列（column）数据类型可以不同。我们可以将其当作电子表格或数据库表。数据读入 pandas.read_csv 是一个基于 matplotlib的 Python 数据可视化库。它提供了更易用的高级接口，用于绘制精美且信息丰富的统计图形。 mpl_toolkits.mplot3d 是一个基础 3D绘图（散点图、平面图、折线图等）工具集，也是 matplotlib 库的一部分。同时，它也支持轻量级的独立安装模式。数据分析（2D） seaborn.lmplot 方法专门用于线性关系的可视化，适用于回归模型。

0 码力 | 46 页 | 5.71 MB | 1 年前
3
《TensorFlow 2项目进阶实战》1-基础理论篇：TensorFlow 2设计思想

TensorFlow 2 核心模块 TensorFlow 2 核心模块概览 tf.keras：分布式和高性能的 Keras • 构建和训练模型的高层次 API • API 完全兼容原生 Keras • 支持保存和加载 TensorFlow SavedModel • 支持 Eager Execution • 支持分布式训练 tf.data：功能强大的数据管理模块支持多种数据处理图像解码 Shuffle py_function 重采样支持多种数据格式图像文件文本文件 CSV 文件 NumPy 数组 Python 生成器 TFRecord 支持多种数据来源本地文件分布式文件系统对象存储系统 tf.distribute：一行代码实现分布式 Training API MirroredStrategy TPUStrategy MultiWorkerMirro redStrategy CentralStorageSt CPU 环境的分布式 YOLOv3 实现》魂斗罗游戏中识别角色 K8s Pod K8s Pod K8s Pod Horovod(CPU) on Kubernetes model TensorFlow Serving Keras 模型训练 • DataGenerator • 随机读取 … … 图片训练集 Ceph 数据并行实现基于 Horoved CPU 平台的分布式模型训练及部署

0 码力 | 40 页 | 9.01 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

图像视频算法库 Bert TextInput Optim izer 性能优越:  分布式存储  分布式查询功能完备:  GSL/负采样  主流图算法  异构图 (user/item/attribute)  动态图标准化: Standard Libraries Graph-Learn: 分布式图算法库标准化: Standard Solutions Continuous Optimization: 问题:  标注成本高  隐私保护 4. 数据获取困难解决方案:  智能标注  自监督学习  多模态预训练  小样本学习解决方案: 智能标注系统iTags 智能抠图智能抠图智能贴合智能预标注 + 人机协同解决方案: 自监督学习 Moby: swin-transformer based moco. Image features 推荐模型特征图像搜索 Intelligence） • 一键部署、弹性扩缩 • 多框架、多语言 • 推理优化Blade • 多维度监控+报警 • 自定义镜像 • 全托管+半托管 • 分布式训练优化 • 超大资源池智能标注可视化建模(Designer) 分布式训练(DLC) 在线服务(EAS) 生态市场开发者工具 • CLI • PAIFlow • OpenAPI AI能力体验中心开源 PAI平台（Platform

0 码力 | 40 页 | 8.51 MB | 1 年前
3
微博在线机器学习和深度学习实践-黄波

• PS&MPI：DistributionStrategy API，统一分布式语义，解耦分布式架构与模型训练框架 • 使用FP16通信，使用FP32做计算，带宽压力降低一倍 • IO优化 • 多线程样本并发读取，样本读取与计算PIPELINE，实现计算与IO的overlap 4 深度学习-深度学习模型训练 • 分布式模型推理框架：WeiServing 异构CPU集群 kubernetes/ol-submit Embedding 数据处理异构GPU集群 CNN 业务应用模型服务框架排序模型服务多媒体分析服务自然语言分析服务集群调度层核心架构层算法模型层 4 深度学习-分布式模型推理 • 推理性能优化 • 减少计算量： operator fusion/XLA/TVM/prune/float16/quantization • 加快计算速度： batching/Ten • operator fusion • 针对特定场景重写耗时算子 • 重构tensorflow计算引擎 • batching • 批量调度请求到GPU，增大并发和吞吐量 4 深度学习-分布式模型推理 • 深度特征效果对比 • 文本Embedding特征，相比于文本标签，相关指标提升约3+% • 基于word2vec、bert等生成embedding向量，提高了语义编码的准确性，降低了训练成本

0 码力 | 36 页 | 16.69 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

更快数据反馈、更少资源消耗  分钟级的数据反馈  增量训练、避免batch重训带来的资源消耗关于Online Learning MLX的模型能力 • 支持千亿级特征、千亿级样本 • 支持计算图模式，模型结构灵活多样  支持推荐、搜索、广告场景常用的深度学习模型  FTRL、FM、FFM、WDL、DCN、DeepFM、MTL等 • Optimizer  FTRL、AdaGrad 与PS通信交换模型参数  计算图的计算 • 计算图框架Graph  计算逻辑抽象op，通过op组合形成模型结构  提供正向（forward）、反向（backward）、Loss的操作扩展模型训练框架 • 模型可变计算路径  运行阶段  计算图裁剪模型训练框架 • 应用场景——离线预计算  模型召回，ANN检索  粗排模型，降低线上计算量 • 分布式Sharding  PS的参数放置策略 • Ps分布式分片的均衡，避免分片大小不一致  NN网络矩阵按行切分，解决请求包不均衡问题  特征按照Hash方式分布式存储 • 模型并行调超参  grid search  random search PS的多模型训练 • 提高内存使用效率  model group内共享特征key的存储 • 超大规模模型 -> 高扇出的分布式PS • 长尾效应：单个

0 码力 | 41 页 | 5.96 MB | 1 年前
3
PyTorch OpenVINO 开发实战系列教程第一篇

是开放源代码的机器学习框架，目的是加速从研究原型到产品开发的过程。其 SDK 主要基于 Python 语言，而 Python 语言作为流行的人工智能开发语言一直很受研究者与开发者的欢迎。其模型训练支持CPU与GPU、支持分布式训练、云部署、针对深度学习特定领域有不同的丰富的扩展库。 1.1.1 Pytorch 历史 Pytorch 在 2016 年由 facebook 发布的开源机器学习（深度学习）框架，Pytorch 语言作为框架的首选编程语言，所以它的名字是在 torch 的前面加上 Py 之后的 Pytorch。由于 Pytorch 吸取了之前一些深度学习框架优点，开发难度大大降低、很容易构建各种深度学习模型并实现分布式的训练，因此一发布就引发学术界的追捧热潮，成为深度学习研究者与爱好者的首选开发工具。在 pytorch 发布之后两年的 2018 年 facebook 又把 caffe2 项目整合到 pytorch 模块、支持 GPU 训练 torch.cuda 模块，这些都是会经常用的。 4）此外本书当中还会重点关注的 torchvison 库中的一些常见模型库与功能函数，主要包括对象检测模块与模型库、图象数据增强与预处理模块等。以上并不是 pytorch 框架中全部模块与功能说明，作者这里只列出了跟本书内容关联密切必须掌握的一些模块功能，希望读者可以更好的针对性学习，掌握这些知识。

0 码力 | 13 页 | 5.99 MB | 1 年前
3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

离线样本⽣成任务数据通道特征处理模型登记模型上线预测请求数据落地⽆量⽤户⾏为数据上报特征库内容获取请求 � 推荐场景的重要性 � PCG的图⽂，视频推荐（腾讯视频，腾讯新闻，QQ看点，浏览器，微视， QQ⼩世界等） � 腾讯系内容推荐：阅⽂集团，QQ⾳乐 � Facebook推荐场景推理成本占AI推理成本的 >72% [ISCA2020 Embedding以稀疏的⽅式表达信息⼤规模推荐模型深度学习系统基本解决维度分布式系统⼤规模模型优化算法 1. ⾼性能 2. 效果⽆损的优化 � Feature 1（基本特点） � Feature 2（数据的时空特点） � Feature3（机器学习的特点）⼤规模推荐模型深度学习系统基本解决维度分布式系统⼤规模模型优化算法 1. ⾼性能 2. 效果⽆损的优化 � Feature 1（基本特点） � Feature 2（数据的时空特点） � Feature3（机器学习的特点）训练框架—基于参数服务器架构的分布式训练框架 TB级模型分⽚存储/更新百TB数据分⽚训练 Feature 1: 动态空间 Feature 2.1:短时间内只有部分item和user 被命中，只有部分参数被⽤到参数按需

0 码力 | 22 页 | 6.76 MB | 1 年前
3

共 54 条前往

页

分类

语言

格式