服务稳定性保障 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

《TensorFlow 2项目进阶实战》2-快速上手篇：动⼿训练模型和部署服务

TensorFlow 2 项目实战进阶扫码试看/订阅《TensorFlow 2 项目进阶实战》视频课程快速上手篇：动⼿训练模型和部署服务 • TensorFlow 2 开发环境搭建 • 使用 tf.keras.datasets 加载数据 • 使用 tf.data.Dataset 加载数据 • 使用 tf.keras.Model 管理模型 • Fashion MNIST 数据集介绍

0 码力 | 52 页 | 7.99 MB | 1 年前
3
微博在线机器学习和深度学习实践-黄波

深度化：深度学习 • 平台化：机器学习平台 2 推荐 • 实时化 • 特征实时化：更及时反馈用户行为，更细粒度刻画用户 • 模型实时化：根据线上样本实时训练模型，及时地反映对象的线上变化模型推理预测服务实时特征实时数据 3 在线机器学习实时样本实时模型训练实时更新参数 Task 训练预处理 Node 实时样本拼接 Node 在线模型训练 Node 离线样本拼接 Node Serving PS Traing PS Traing Model System Predict Score Sample Data worker worker worker 3 在线机器学习-参数服务器 serving serving serving server server server server server worker worker worker PSscheduler System 3 在线机器学习-参数服务器 • 参数规模 • 支持百亿特征维度，千亿参数 • 模型版本 • 多模型多版本：多组实验并行执行，提高实验迭代效率 • 在线版本切换：基于ZK的版本感知机制，动态进行版本切换，实现BASE模型的热更新，实时训练与离线训练周期模型融合 • 模型结构训练与推理兼容：在线PS与离线PS模型结构兼容，自动模型参数转换 • 稳定性优化 • 模型快照：基于ps

0 码力 | 36 页 | 16.69 MB | 1 年前
3
动手学深度学习 v2.0

7.4 训练神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 4.8 数值稳定性和模型初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 4.8.1 梯度消失和梯度爆炸训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537 12.7 参数服务器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540 12.7 . . . . . . . . . . . . . . . . . . 758 16.4 选择服务器和GPU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 758 16.4.1 选择服务器 . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 797 页 | 29.45 MB | 1 年前
3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文

获得全球三十大最佳AI企业等荣誉，拥有国家级高新技术企业、CMMI3资质认证、ISO9001质量管理体系认证、双软认证等最全面的企业服务资质。权威认证的人工智能服务，可充分保障客户业务实践与业务安全 l 覆盖金融、制造、法律、电商、传媒等行业，提升企业文档自动化处理能力为数百家中国知名客户提供完善的文本智能处理服务 01 文本智能处理背景简介 7 文本语音图像人工智能 Voice Image 0, 0, 0, 0, 0, 0, 0, 0, 0, … ] [ 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, … ] 服务器 [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, … ] [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

0 码力 | 46 页 | 25.61 MB | 1 年前
3
搜狗深度学习技术在广告推荐领域的应用

特征量巨大；模型复杂度受限连续特征连续特征需要仔细设计；定长；特征稠密特征量相对较小，可以使用多种模型训练模型类别模型类别线性  简单、处理特征量大、稳定性好  需借助交叉特征  Logistic Regression 非线性  能够学习特征间非线性关系  模型复杂、计算耗时  DNN、GBDT 模型融合 • 将多个模型的输出CTR加权平均加大数据量，提升模型稳定性  加大数据量，提升模型收益方案  MxNet支持多机多卡, 使用成本低  构建多机多卡 GPU集群，优化训练效率，提高加速比现状和计划现状  已经实现LR+DNN融合模型的上线，收益较好  受限于线上计算资源，模型复杂度有限  线下训练流程有依赖，繁琐易出错计划  线上服务拆分，独立出深度学习计算模块，采用低功耗GPU加速

0 码力 | 22 页 | 1.60 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

jd.com/12954866.html ❑ 联系邮箱(一般问题建议 Github issues 交流)：liangqu.long AT gmail.com ❑ 配套视频课程(收费，提供答疑等全服务，比较适合初学者)：深度学习与 TensorFlow 入门实战深度学习与 PyTorch 入门实战 https://study.163.com/course/courseMai n.htm 亿个，甚至发布之初一度以技术安全考虑为由拒绝开源 GPT-2 模型。聊天机器人(Chatbot) 聊天机器人也是自然语言处理的一项主流任务，机器自动学习与人类对话，对于人类的简单诉求提供满意的自动回复，提高客户的服务效率和服务质量等。常应用在咨询系统、娱乐系统、智能家居等中。预览版202112 第 1 章人工智能绪论 12 1.4.3 强化学习虚拟游戏相对于真实环境，虚拟游戏 log_softmax，他就是在完成 Softmax 计算后，再进行 Log 运算。在 Softmax 函数的数值计算过程中，容易因输入值偏大发生数值溢出现象；在计算交叉熵时，也会出现数值溢出的问题。为了数值计算的稳定性，PyTorch 中提供了一个统一的接口 nn.CrossEntropyLoss 类，将 Softmax 函数和交叉熵损失函数同时实现，同时也处理了可能发生数值不稳定的异常，一般推荐使用这个接口，避免自行调用

0 码力 | 439 页 | 29.91 MB | 1 年前
3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

内容特征组合特征标签匹配度用户互动率协同特征实时互动率 app互动率微博内容关注数据用户信息视觉标签打码日志社交关系用户特征发博流互动流曝光流模型服务模型训练模型优化模型评估模型预测 CTR预估排序策略权值映射业务排序其他策略特征工程特征存储特征查询实时数据自解释特征 1 2 3 深度学习应用与实践 End2End框架 Ø 优势 • Deep和FM共享 embedding层总结展望 Ø 模型算法是手段 • 模型算法殊途同归 • 业务和数据决定模型算法的应用场景 • 计算力和算法架构是保障总结展望 Ø 未来工作 • 更多的融合网络结构适用于CTR预估场景 • 多模态—更好的对非结构化内容进行表征 • 用户行为序列embedding

0 码力 | 21 页 | 2.14 MB | 1 年前
3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒

6000万张人脸训练 2016 2017 What’s Next? 2018 自我演化的异构人工智能云云原生的深度学习数据闭环自进化深度学习系统高度定制的图片、特征仓库深度学习应用服务场景相关业务数据清洗-查询深度学习训练平台模型测试与验证深度学习算法在产品应用中的挑战 • 深度学习算法也需要“深度”学习业务需求 - 处理特殊输入，如模糊、黑白照片 - 适配具有不同特征的数据源适配具有不同特征的数据源 - 在严肃应用中，客户追求100%准确率，算法性能提升永无止境 • 深度学习模型需要在准确率和速度上做均衡 - 使用更加精巧的模型和Operator设计 - 使用模型压缩算法，在基本保障准确率的情况下大幅提升速度 - 利用最新的硬件特性，如GPU TensorCore/int8 *示意图来自互联网 Kubernetes在异构系统调度中的挑战 • Kubernetes版本发布

0 码力 | 23 页 | 9.26 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

逻辑阶段抽象，业务根据自身需求选择性实现  数据获取：根据业务的自身逻辑获取特征原始数据  特征抽取：将特征数据进行转换，转换成模型所需的格式，比如离散化  模型计算：传入转换后的特征数据，调用模型计算引擎在线预估服务 • 特征编码方式  通过明文hash的方式编码  适用于特征的动态增长  不需要预分配，提高处理效率 • 框架与实现分离  提供op形式的特征抽取类  逻辑一致性：在线、近线、离线线上的响应时间要求高，通常在几到十几ms • 简单模型  计算耗时短：线性模型LR、树模型  模型表达能力不足，效果一般 • 复杂模型  DNN模型解决耗时是关键，利用预计算解决耗时问题  效果保障：保证用户的个性化信息，降低候选集计算复杂度粗排模型 • 精排阶段的特点  候选集较少，通常在百级别  线上耗时相对宽松，几十毫秒（视效果而定） • 精排模型的特点  结构复杂，怎么有效果怎么来

0 码力 | 41 页 | 5.96 MB | 1 年前
3
机器学习课程-温州大学-08深度学习-深度卷积神经网络

总的来说，DenseNet和ResNet都是很优秀的卷积神经网络结构，但 DenseNet通过建立密集连接，使每一层都直接接收到多个之前层的特征图输出，增强了特征的流动和复用，从而在模型性能和训练稳定性上表现更好。 22 3.其它现代网络 EfficientNet EfficientNet是一种基于自动模型缩放的神经网络结构，由谷歌团队于2019年提出，该模型在图像分类、目标检测和图像分割等任

0 码力 | 32 页 | 2.42 MB | 1 年前
3

共 32 条前往

页

分类

语言

格式