 动手学深度学习 v2.0如果读者以前没有使用过Python语言,那么可以仔细阅读这个Python教程3。 论坛 与本书相关,我们已经启动了一个论坛,在discuss.d2l.ai4。当对本书的任何一节有疑问时,请在每一节的末 尾找到相关的讨论页链接。 致谢 感谢中英文草稿的数百位撰稿人。他们帮助改进了内容并提供了宝贵的反馈。感谢Anirudh Dagar和唐源将 部分较早版本的MXNet实现分别改编为PyTorch和T 颠倒输入和输出的顺序非常 重要。换句话说,虽然我们仍将一个序列转换成另一个序列,但是输入和输出的数量以及相应序列的顺序大 都不会相同。比如下面这个例子,“错误的对齐”反应了德国人喜欢把动词放在句尾的特殊倾向。 德语: Haben Sie sich schon dieses grossartige Lehrwerk angeschaut? 英语: Did you already check out 是普遍存在。 为了实现这些复杂的网络,我们引入了神经网络块的概念。块(block)可以描述单个层、由多个层组成的组 件或整个模型本身。使用块进行抽象的一个好处是可以将一些块组合成更大的组件,这一过程通常是递归的, 如 图5.1.1所示。通过定义代码来按需生成任意复杂度的块,我们可以通过简洁的代码实现复杂的神经网络。 图5.1.1: 多个层被组合成块,形成更大的模型 从编程的角度来看,块由类(cla0 码力 | 797 页 | 29.45 MB | 1 年前3 动手学深度学习 v2.0如果读者以前没有使用过Python语言,那么可以仔细阅读这个Python教程3。 论坛 与本书相关,我们已经启动了一个论坛,在discuss.d2l.ai4。当对本书的任何一节有疑问时,请在每一节的末 尾找到相关的讨论页链接。 致谢 感谢中英文草稿的数百位撰稿人。他们帮助改进了内容并提供了宝贵的反馈。感谢Anirudh Dagar和唐源将 部分较早版本的MXNet实现分别改编为PyTorch和T 颠倒输入和输出的顺序非常 重要。换句话说,虽然我们仍将一个序列转换成另一个序列,但是输入和输出的数量以及相应序列的顺序大 都不会相同。比如下面这个例子,“错误的对齐”反应了德国人喜欢把动词放在句尾的特殊倾向。 德语: Haben Sie sich schon dieses grossartige Lehrwerk angeschaut? 英语: Did you already check out 是普遍存在。 为了实现这些复杂的网络,我们引入了神经网络块的概念。块(block)可以描述单个层、由多个层组成的组 件或整个模型本身。使用块进行抽象的一个好处是可以将一些块组合成更大的组件,这一过程通常是递归的, 如 图5.1.1所示。通过定义代码来按需生成任意复杂度的块,我们可以通过简洁的代码实现复杂的神经网络。 图5.1.1: 多个层被组合成块,形成更大的模型 从编程的角度来看,块由类(cla0 码力 | 797 页 | 29.45 MB | 1 年前3
 OpenShift Container Platform 4.6 节点在匹配 在匹配项 项中 中应 应用的 用的 Tuned 配置集。例如 配置集。例如 tuned_profile_1。 。 OpenShift Container Platform 4.6 节点在匹配 在匹配项 项中 中应 应用的 用的 Tuned 配置集。例如 配置集。例如 tuned_profile_1。 。- 是一个 是一个递归 递归定 定义 义的可 的可选 选数 数组 组,如下所示: ,如下所示: recommend: - # ... - - - ] - : - 第 第 6 章 章 操作容器 操作容器 313 如果目 如果目录 录名以路径分隔符 名以路径分隔符 (/) 结 结尾, 尾,则 则只有目 只有目录 录的内容会复制到目的地。否 的内容会复制到目的地。否则 则,目 ,目录 录及其内容都会复制 及其内容都会复制 到目的地。 到目的地。 指定复制目的地 指定复制目的地 0 码力 | 404 页 | 3.60 MB | 1 年前3
 机器学习课程-温州大学-07机器学习-决策树⑥ ⑤ ④ ③ ② {6,7,15} {7,15} {1,2,3,14} 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 剪枝决策树。 C4.5 采用的悲观剪枝方法,用递归的方式从低往上针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 后剪枝决策树的欠拟合风险很小,泛化性能往往优于 预剪枝决策树。 25 C4.5的剪枝 后剪枝 后剪枝的决策树 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 剪枝决策树。 C4.5 采用的悲观剪枝方法,用递归的方式从低往上针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 这种方法需要使用一个单独的测试数据集来评估所有的树,根据它们在测试数据 集熵的分类性能选出最佳的树。 36 CART算法 CART剪枝 具体流程: (1)计算每一个结点的条件熵 (2)递归的从叶子节点开始往上遍历, 减掉叶子节点,然后判断损失函数的 值是否减少,如果减少,则将父节点 作为新的叶子节点 (3)重复(2),直到完全不能剪枝. 平坦 纹理 色泽 好瓜 坏瓜 根蒂0 码力 | 39 页 | 1.84 MB | 1 年前3 机器学习课程-温州大学-07机器学习-决策树⑥ ⑤ ④ ③ ② {6,7,15} {7,15} {1,2,3,14} 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 剪枝决策树。 C4.5 采用的悲观剪枝方法,用递归的方式从低往上针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 后剪枝决策树的欠拟合风险很小,泛化性能往往优于 预剪枝决策树。 25 C4.5的剪枝 后剪枝 后剪枝的决策树 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 剪枝决策树。 C4.5 采用的悲观剪枝方法,用递归的方式从低往上针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 这种方法需要使用一个单独的测试数据集来评估所有的树,根据它们在测试数据 集熵的分类性能选出最佳的树。 36 CART算法 CART剪枝 具体流程: (1)计算每一个结点的条件熵 (2)递归的从叶子节点开始往上遍历, 减掉叶子节点,然后判断损失函数的 值是否减少,如果减少,则将父节点 作为新的叶子节点 (3)重复(2),直到完全不能剪枝. 平坦 纹理 色泽 好瓜 坏瓜 根蒂0 码力 | 39 页 | 1.84 MB | 1 年前3
 Rancher 用户手册 v1.0务,每个镜像有特定的唯一标识(镜 像的仓库地址+镜像名称+镜像 Tag)。 7.3. Kubernetes(k8s) Kubernetes,又称为 k8s(首字母为 k、首字母与尾字母之间有 8 个字符、尾字母为 s,所以 简称 k8s)或者简称为“kube”,是一种可自动实施 Linux 容器操作的开源平台。它可以帮助用 户省去应用容器化过程的许多手动部署和扩展操作。也就是说,您可以将运行0 码力 | 35 页 | 6.47 MB | 1 年前3 Rancher 用户手册 v1.0务,每个镜像有特定的唯一标识(镜 像的仓库地址+镜像名称+镜像 Tag)。 7.3. Kubernetes(k8s) Kubernetes,又称为 k8s(首字母为 k、首字母与尾字母之间有 8 个字符、尾字母为 s,所以 简称 k8s)或者简称为“kube”,是一种可自动实施 Linux 容器操作的开源平台。它可以帮助用 户省去应用容器化过程的许多手动部署和扩展操作。也就是说,您可以将运行0 码力 | 35 页 | 6.47 MB | 1 年前3
 TensorFlow on Yarn:深度学习遇上大数据NodeManager上可用的GPU卡数是: 2 + 2 + 2 + 2 = 8� � � TensorFlow on Yarn技术细节揭秘 NodeManager端GPU亲和性调度:� 后序、递归、深度优先分配算法 深度学习平台演进 SparkFlow介绍 SparkFlow:360系统部⼤数据团队设计的TensorFlow on Spark解决⽅案� • Coordinato0 码力 | 32 页 | 4.06 MB | 1 年前3 TensorFlow on Yarn:深度学习遇上大数据NodeManager上可用的GPU卡数是: 2 + 2 + 2 + 2 = 8� � � TensorFlow on Yarn技术细节揭秘 NodeManager端GPU亲和性调度:� 后序、递归、深度优先分配算法 深度学习平台演进 SparkFlow介绍 SparkFlow:360系统部⼤数据团队设计的TensorFlow on Spark解决⽅案� • Coordinato0 码力 | 32 页 | 4.06 MB | 1 年前3
 机器学习课程-温州大学-Scikit-learnnc, k) 过滤式(Filter),保留得分排名前k的特征(top k方式) fs.RFECV(estimator, scoring=“r2”) 封装式(Wrap- per),结合交叉验证的递归特征消除法,自动选择最优特征个数 fs.SelectFromModel(estimator) 嵌入式(Embedded),从 模型中自动选择特征,任何具有coef_或者 feature_importances_的0 码力 | 31 页 | 1.18 MB | 1 年前3 机器学习课程-温州大学-Scikit-learnnc, k) 过滤式(Filter),保留得分排名前k的特征(top k方式) fs.RFECV(estimator, scoring=“r2”) 封装式(Wrap- per),结合交叉验证的递归特征消除法,自动选择最优特征个数 fs.SelectFromModel(estimator) 嵌入式(Embedded),从 模型中自动选择特征,任何具有coef_或者 feature_importances_的0 码力 | 31 页 | 1.18 MB | 1 年前3
 OpenShift Container Platform 4.9 节点配置集。例如 tuned_profile_1。 可选操作对象配置。 为 TuneD 守护进程打开或关闭调试。true 为打开,false 为关闭。默认值为 false。 OpenShift Container Platform 4.9 节点配置集。例如 tuned_profile_1。 可选操作对象配置。 为 TuneD 守护进程打开或关闭调试。true 为打开,false 为关闭。默认值为 false。- 是一个递归定义的可选数组,如下所示: 节点或 pod 标签名称。 可选的节点或 pod 标签值。如果省略, - 足以匹配。 可选的对象类型(node 或 pod)。如果省略,会使用 node。 目 目录时 录时,目 ,目录 录名称必 名称必须 须加上 加上 pod 名称前 名称前缀 缀: : 如果目 如果目录 录名以路径分隔符 名以路径分隔符 (/) 结 结尾, 尾,则 则只有目 只有目录 录的内容会复制到目的地。否 的内容会复制到目的地。否则 则,目 ,目录 录及其内容都会复制 及其内容都会复制 到目的地。 到目的地。 指定复制目的地 指定复制目的地 0 码力 | 374 页 | 3.80 MB | 1 年前3
 consul 命令行这在Consul 0.7及更高版本中可用。 ● domain:默认情况下,Consul在“consul”中响应DNS查询。域。此标志可用于更改该域。假定 域中的所有查询都由Consul处理,不会以递归方式解析。 ● enable-script-checks:这可以控制是否在此代理上启用了执行脚本的运行状况检查,默认为false 营商必须选择允许这些检查。如果启用,建议还启用ACL以控制允许哪些用户注册新检查以执行脚本0 码力 | 5 页 | 346.62 KB | 1 年前3 consul 命令行这在Consul 0.7及更高版本中可用。 ● domain:默认情况下,Consul在“consul”中响应DNS查询。域。此标志可用于更改该域。假定 域中的所有查询都由Consul处理,不会以递归方式解析。 ● enable-script-checks:这可以控制是否在此代理上启用了执行脚本的运行状况检查,默认为false 营商必须选择允许这些检查。如果启用,建议还启用ACL以控制允许哪些用户注册新检查以执行脚本0 码力 | 5 页 | 346.62 KB | 1 年前3
 机器学习课程-温州大学-特征工程中国各地区人口特征和房价波动的动态关系[J].统计研究,2019,36(01) ➢ 使用一个基模型来进行多轮训练,每轮 训练后,消除若干权值系数的特征,再 基于新的特征集进行下一轮训练。 2. 递归特征消除法 包裹式 4. 特征选择 原始特征集合 基模型训练 新特征子集合 特征个数是否达到预设值 输出子集合 否 是 35 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J]0 码力 | 38 页 | 1.28 MB | 1 年前3 机器学习课程-温州大学-特征工程中国各地区人口特征和房价波动的动态关系[J].统计研究,2019,36(01) ➢ 使用一个基模型来进行多轮训练,每轮 训练后,消除若干权值系数的特征,再 基于新的特征集进行下一轮训练。 2. 递归特征消除法 包裹式 4. 特征选择 原始特征集合 基模型训练 新特征子集合 特征个数是否达到预设值 输出子集合 否 是 35 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J]0 码力 | 38 页 | 1.28 MB | 1 年前3
 机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入析,可以很好地推广到其他任务 ✓ 2017年,在Ashish Vaswani et.al 的论文《Attention Is All You Need》 中,考虑到主导序列转导模型基于编码器-解码器配置中的复杂递归或卷积 神经网络,性能最好的模型被证明还是通过注意力机制(attention mechanism)连接编码器和解码器,因而《Attention Is All You Need》 中提出了0 码力 | 44 页 | 2.36 MB | 1 年前3 机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入析,可以很好地推广到其他任务 ✓ 2017年,在Ashish Vaswani et.al 的论文《Attention Is All You Need》 中,考虑到主导序列转导模型基于编码器-解码器配置中的复杂递归或卷积 神经网络,性能最好的模型被证明还是通过注意力机制(attention mechanism)连接编码器和解码器,因而《Attention Is All You Need》 中提出了0 码力 | 44 页 | 2.36 MB | 1 年前3
共 31 条
- 1
- 2
- 3
- 4













