DataStore 策略 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

【PyTorch深度学习-龙龙老师】-测试版202112

训练难题 13.7 WGAN 原理 13.8 WGAN-GP 实战 13.9 参考文献第 14 章强化学习 14.1 先睹为快 14.2 强化学习问题 14.3 策略梯度方法 14.4 值函数方法 14.5 Actor-Critic 方法 14.6 小结 14.7 参考文献第 15 章自定义数据集 15.1 精灵宝可梦数据集 Learning)。在训练时，通过计算模型的预测值??(?)与自身?之间的误差来优化网络参数?。常见的无监督学习算法有自编码器、生成对抗网络等。强化学习也称为增强学习，通过与环境进行交互来学习解决问题的策略的一类算法。与有监督学习、无监督学习不同，强化学习问题并没有明确的“正确的”动作监督信号，预览版202112 1.2 神经网络发展简史 3 算法需要与环境进行交互，获取环境人工智能=深度学习+强化学习 − David Silver 本章节代码部分尚未完成修改！强化学习是机器学习领域除有监督学习、无监督学习外的另一个研究分支，它主要利用智能体与环境进行交互，从而学习到能获得良好结果的策略。与有监督学习不同，强化学习的动作并没有明确的标注信息，只有来自环境的反馈的奖励信息，它通常具有一定的滞后性，用于反映动作的“好与坏”。随着深度神经网络的兴起，强化学习这一领域也获得了蓬勃的发展。2015

0 码力 | 439 页 | 29.91 MB | 1 年前
3
机器学习课程-温州大学-14深度学习-Vision Transformer (ViT)

深度学习-Vision Transformer (ViT) 黄海广副教授 2 03 模型训练策略本章目录 01 背景知识 02 模型介绍 04 模型的缺点与改进 05 模型的代码实现 3 1.背景知识 03 模型训练策略 01 背景知识 02 模型介绍 04 模型的缺点与改进 05 模型的代码实现（ViT）将击败CNN（小幅度） Vision Transformer（ViT）实际上就是Transformer的encode网络。 1.背景知识 8 2.模型介绍 03 模型训练策略 01 背景知识 02 模型介绍 04 模型的缺点与改进 05 模型的代码实现 9 模型思路 2.模型介绍 1.图片切分为patch 2.patch转化为embedding W)是图像的高和宽；C是图像通道数；? = ??/?2，即patch的个数。 2.模型介绍 24 3.模型训练策略 03 模型训练策略 01 背景知识 02 模型介绍 04 模型的缺点与改进 05 模型的代码实现 25 3.模型训练策略训练策略模型在Dataset A上预训练，在Dataset B上精调，在Dataset B上评估 26 数据集介绍

0 码力 | 34 页 | 2.78 MB | 1 年前
3
机器学习课程-温州大学-07机器学习-决策树

老年否是非常好是 11 老年否是好是 12 老年是否好是 13 老年是否非常好是 14 老年否否一般否 15 ID3算法缺点 ID3 没有剪枝策略，容易过拟合；信息增益准则对可取值数目较多的特征有所偏好，类似“编号”的特征其信息增益接近于 1；只能用于处理离散分布的特征；没有考虑缺失值。 16 3.C4.5算法 01 决策树原理有数据都具有的一般性质，从而导致过拟合。剪枝的基本策略有“预剪枝”（prepruning）和“后剪枝”（post-pruning）通过剪枝处理去掉一些分支来降低过拟合的风险。 20 C4.5的剪枝预剪枝（prepruning）预剪枝不仅可以降低过拟合的风险而且还可以减少训练时间，但另一方面它是基于“贪心” 策略，会带来欠拟合风险。编号色泽根蒂敲声纹理脐部坏瓜坏瓜好瓜好瓜好瓜好瓜好瓜乌黑凹陷硬挺稍糊清晰蜷曲稍蜷模糊青绿稍凹浅白青绿乌黑浅白 ① ⑥ ⑤ ④ ③ ② 剪枝策略在节点划分前来确定是否继续增长，及早停止增长主要方法有： • 节点内数据样本低于某一阈值； • 所有节点特征都已分裂； • 节点划分前准确率比划分后准确率高。 22 C4.5的剪枝

0 码力 | 39 页 | 1.84 MB | 1 年前
3
动手学深度学习 v2.0

11.2 学习率调度器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495 11.11.3 策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497 12 计算性能概念，并提供可独立工作的例子——使用真实的数据集。这带来了组织上的挑战。某些模型可能在逻辑上组合在单节中。而一些想法可能最好是通过连续允许几个模型来传授。另一方面，坚持“一个工作例子一节”的策略有一个很大的好处：这使你可以通过利用我们的代码尽可能轻松地启动你自己的研究项目。只需复制这一节的内容并开始修改即可。我们将根据需要将可运行代码与背景材料交错。通常，在充分解释工具之前，我们常常会在提供工具这一方 reward）。此后新一轮循环开始，智能体接收后续观察，并选择后续操作，依此类推。强化学习的过程在图1.3.7 中进行了说明。请注意，强化学习的目标是产生一个好的策略（policy）。强化学习智能体选择的“动作”受策略控制，即一个从环境观察映射到行动的功能。 30 1. 引言图1.3.7: 强化学习和环境之间的相互作用强化学习框架的通用性十分强大。例如，我们可以将任何监督学习问题转化为强化学习问题。假设我们有一

0 码力 | 797 页 | 29.45 MB | 1 年前
3
机器学习课程-温州大学-08机器学习-集成学习

…… 预测1 预测2 训练数据最终预测结果测试数据 5 Boosting 训练过程为阶梯状，基模型按次序一一进行训练（实现上可以做到并行），基模型的训练集按照某种策略每次都进行一定的转化。对所有基模型预测的结果进行线性综合产生最终的预测结果。集成学习模型n 最终预测结果模型2 预测n …… 预测1 预测2 转化模型1 模型3 Adaboost算法算法思想：后一个模型的训练永远是在前一个模型的基础上完成模型n 模型1 模型2 带权重n的训练集带权重2的训练集带权重1的训练集训练数据结合策略弱学习器1 基于学习的误差率1 更新学习器权重1 弱学习器2 基于学习的误差率2 更新学习器权重2 弱学习器n 基于学习的误差率n 更新学习器权重n 根据权重1更新样本权重2 Decision Tree）是一种迭代的决策树算法，该算法由多棵决策树组成，GBDT 的核心在于累加所有树的结果作为最终结果，所以 GBDT 中的树都是回归树，不是分类树，它是属于 Boosting 策略。GBDT 是被公认的泛化能力较强的算法。 GBDT 由三个概念组成： Regression Decision Tree（即 DT）、Gradient Boosting（即 GB），和 Shrinkage（缩减）

0 码力 | 50 页 | 2.03 MB | 1 年前
3
机器学习课程-温州大学-13机器学习-人工神经网络

在趋向无穷的地方，函数值变化很小，容易出现梯度消失，不利于深层神经的反馈传输 2.幂函数的梯度计算复杂 3.收敛速度比较慢 17 3.BP算法主要步骤第一步，对样本明确预测输出值与损失函数第二步，明确参数调整策略第三步，计算输出层阈值的梯度第四步，计算隐层到输出层连接权值的梯度第五步，计算隐层阈值的梯度第六步，计算输入层到隐层连接权值的梯度第七步，引出归纳结论 18 3.BP算法第一步，明确损失函数 =1 ? ො?? ? − ?? ? 2 19 3.BP算法算法步骤基于梯度下降（Gradient Descent）策略，以目标的负梯度方向对参数进行调整 ? = ? + ∆? ∆? = −? ??? ?? 第二步，明确参数调整策略 1h v 输入层输出层隐层 ,1 kx , k i x , k d x 1b 2b hb qb . . .

0 码力 | 29 页 | 1.60 MB | 1 年前
3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博

微博内容关注数据用户信息视觉标签打码日志社交关系用户特征发博流互动流曝光流模型服务模型训练模型优化模型评估模型预测 CTR预估排序策略权值映射业务排序其他策略特征工程特征存储特征查询实时数据自解释特征 1 2 3 深度学习应用与实践常规CTR方法排序微博Feed流排序场景介绍目录为什么选择深度学习 Ø

0 码力 | 21 页 | 2.14 MB | 1 年前
3
Chatbots 中对话式交互系统的分析与应用

Task-Bot: 任务对话机器人 Task-Bot: task-oriented bot 用户语音合成 (TTS) 语言产生 (NLG) 语音识别 (ASR) 语言理解 (SLU) 策略优化 (DPO) 状态追踪 (DST) inform(order_op=预订, restaurant_name=云海肴, subbranch=中关村店) request(phone, name) 对话状态应该包含持续对话所需要的各种信息 • DST问题：依据最新的系统和用户动作，更新对话状态 • Q：如何表示对话状态状态追踪 (DST) 旧状态用户动作系统动作新状态策略优化 Dialogue Policy Optimization (DPO) • 系统如何做出反馈动作 • 作为序列决策过程进行优化：增强学习 Milica Gašić (2014) 语言生成

0 码力 | 39 页 | 2.24 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

模型数据通路  Base + Delta方式  增量提供ACK机制，确保模型正确性 Parameter Server • 模型数据的统一管理  模型结构  模型参数 PS的参数放置策略 • Ps分布式分片的均衡，避免分片大小不一致  NN网络矩阵按行切分，解决请求包不均衡问题  特征按照Hash方式分布式存储 • 模型并行调超参  grid search  random MLX平台架构 • 模型场景应用  召回模型  排序模型 • 漏斗模型 • 召回模型 • 排序模型美团推荐场景的应用漏斗模型推荐的漏斗模型候选集召回粗排精排策略漏斗模型数千数百千万展位数十 • 模型的设计 • 样本&特征的设计 • 模型的通路模型召回解决方案 • 基于双塔的模型召回架构  基于用户和item的DNN结构 

0 码力 | 41 页 | 5.96 MB | 1 年前
3
房源质量打分中深度学习应用及算法优化-周玉驰

2019 KE.COM ALL COPYRIGHTS RESERVED 1 周玉驰贝壳找房 - 数据智能中心 - 策略算法部 AI选房中深度学习的实践及优化 2019 KE.COM ALL COPYRIGHTS RESERVED 2 2019 KE.COM ALL COPYRIGHTS RESERVED 2 2019 KE.COM ALL COPYRIGHTS RESERVED 3 自我介绍周玉驰  硕士毕业于中科院  先后就职于华为，百度和医渡云  目前就职于贝壳找房  主要负责两个方向  房源策略算法  房客人关系图谱扫一扫二维码图案，加我微信 2019 KE.COM ALL COPYRIGHTS RESERVED 4 目录  为什么要做AI选房  如何做AI选房  模型演变历程  实践应用  总结&思考 2019

0 码力 | 48 页 | 3.75 MB | 1 年前
3

共 26 条前往

页

分类

语言

格式