输出插件 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

深度学习与PyTorch入门实战 - 19.2 多输出感知机

0 码力 | 9 页 | 584.25 KB | 1 年前
3
深度学习与PyTorch入门实战 - 19.1 单一输出感知机

0 码力 | 8 页 | 548.71 KB | 1 年前
3
Keras: 基于 Python 的深度学习库

. . . . . . . . 17 3.2.3 所有的模型都可调用，就像网络层一样 . . . . . . . . . . . . . . . . . . . . 17 3.2.4 多输入多输出模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.2.5 共享网络层 . . . . . . . . . . . . . 30 3.3.7 为什么训练误差比测试误差高很多？ . . . . . . . . . . . . . . . . . . . . . . 31 3.3.8 如何获取中间层的输出？ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.3.9 如何用 Keras 处理超过内存的数据集？ . . . . . batch_size=16) 3.1.5.6 基于栈式 LSTM 的序列分类在这个模型中，我们将 3 个 LSTM 层叠在一起，使模型能够学习更高层次的时间表示。前两个 LSTM 返回完整的输出序列，但最后一个只返回输出序列的最后一步，从而降低了时间维度（即将输入序列转换成单个向量）。 from keras.models import Sequential from keras.layers import

0 码力 | 257 页 | 1.19 MB | 1 年前
3
动手学深度学习 v2.0

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 6.4 多输入多输出通道 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 6.4.1 多输入通道多输入通道 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 6.4.2 多输出通道 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 6.4.3 1 × 1 卷积层 . 们不得不自行组装。我们在 16.5节中详细描述了我们的方法。我们选择GitHub来共享源代码并允许编辑，选择Jupyter记事本来混合代码、公式和文本，选择Sphinx作为渲染引擎来生成多个输出，并为论坛提供讨论。虽然我们的体系尚不完善，但这些选择在相互冲突的问题之间提供了一个很好的妥协。我们相信，这可能是第一本使用这种集成工作流程出版的书。 1 http://distill.pub

0 码力 | 797 页 | 29.45 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

经典数据集加载 5.8 MNIST 测试实战 5.9 参考文献第 6 章神经网络 6.1 感知机 6.2 全连接层 6.3 神经网络 6.4 激活函数 6.5 输出层设计 6.6 误差计算 6.7 神经网络类型 6.8 油耗预测实战 6.9 参考文献第 7 章反向传播算法 7.1 导数与梯度 7.2 导数常见性质 7.3 力较为有限，而深层的神经网络擅长提取高层、抽象的特征，因此具有更好的性能表现。针对特定任务的检测逻辑输出逻辑人为设计的特征检测方法输出逻辑特征提取网络 (浅层) 输出子网络底层特征提取网络中层特征提取网络高层特征提取网络输出子网络基于规则的系统传统机器学习浅层神经网络深度学习图 1.3 深度学习与其它算法比较根据生物神经元(Neuron) 结构，提出了最早的神经元数学模型，称为 MP 神经元模型。该模型的输出?(?) = ℎ(?(?))，其中?(?) = ∑ ?? ? , ?? ∈ {0,1}，模型通过?(?)的值来完成输出值的预测，如图 1.4 所示。如果?(?) ≥ 0，输出为 1；如果?(?) < 0，输出为 0。可以看到，MP 神经元模型并没有学习能力，只能完成固定逻辑的判定。 ? ℎ

0 码力 | 439 页 | 29.91 MB | 1 年前
3
机器学习课程-温州大学-13机器学习-人工神经网络

BP算法 4 1.人工神经网络发展历史发展历史 1943年，心理学家McCulloch和逻辑学家Pitts建立神经网络的数学模型， MP模型神经元数学模型神经元生理结构输入层输出层隐藏层 5 1.人工神经网络发展历史 1960年代，人工网络得到了进一步地发展感知机和自适应线性元件等被提出。 M.Minsky仔细分析了以感知机为代表的神经网络的局限性，指出了感知机不能解决 McClelland为首的科学家提出了 BP（Back Propagation）神经网络的概念，是一种按照误差逆向传播算法训练的多层前馈神经网络，目前是应用最广泛的神经网络。 BP神经网络模型 1h v 输入层输出层隐层 ,1 kx , k i x , k d x 1b 2b hb qb . . . . . . . . . . . . ,1 ˆky , ˆk j y , ˆk l ELM)，是由黄广斌提出的用于处理单隐层神经网络的算法优点： 1.学习精度有保证 2.学习速度快随机初始化输入权重??和偏置，只求解输出权重值??。 1 nx 1 ? ? i  n 1  i L  1  L  ny 1个输出层神经元 ?个隐藏层神经元 ?个输入层神经元 9 2.感知器算法 01 发展历史 02 感知机算法 03 BP算法

0 码力 | 29 页 | 1.60 MB | 1 年前
3
机器学习课程-温州大学-13深度学习-Transformer

token和前一次的隐藏状态，然后得到输出。它的时序结构使得这个模型能够得到长距离的依赖关系，但是这也使得它不能够并行计算，模型效率十分低。在没有transformer的时候，我们都是用什么来完成这系列的任务的呢？ 5 1.Transformer介绍 Seq2Seq任务 Seq2Seq 任务指的是输入和输出都是序列的任务，输出的长度不确定时采用的模型，这种情况一般是在机器翻用的模型，这种情况一般是在机器翻译的任务中出现，将一句中文翻译成英文，那么这句英文的长度有可能会比中文短，也有可能会比中文长，所以输出的长度就不确定了。上图，输入的中文长度为4，输出的英文长度为2 6 1.Transformer介绍 Encoder-Decoder模型通常来说，Seq2Seq任务最常见的是使用Encoder+Decoder的模式，先将一个序列编码成一个上下文矩阵，在使用D Transformer的工作流程 04 BERT 14 2.Transformer的工作流程从宏观的视角开始首先将这个模型看成是一个黑箱操作。在机器翻译中，就是输入一种语言，输出另一种语言。 15 2.Transformer的工作流程那么拆开这个黑箱，我们可以看到它是由编码组件、解码组件和它们之间的连接组成。 16 2.Transformer的工作流程编码组件部分由一堆编

0 码力 | 60 页 | 3.51 MB | 1 年前
3
机器学习课程-温州大学-03深度学习-PyTorch入门

11 1.Tensor张量乘法 1. 二维矩阵乘法 torch.mm() torch.mm(mat1, mat2, out=None) 其中???1 ∈ ℝ?×?,???2 ∈ ℝ?×?, 输出的??? ∈ ℝ?×? 该函数一般只用来计算两个二维矩阵的矩阵乘法，并且不支持 broadcast操作。 12 1.Tensor张量乘法 2. 三维带batch的矩阵乘法 torch.bmm() out=None)乘法首先是进行后两位矩阵乘法得到(99×11)×(11×99)⇒(99×99)，然后分析两个参数的batch size分别是 (1000×500) 和 500, 可以广播成为 (1000×500)，因此最终输出的维度是 (1000×500×99×99)。 14 1.Tensors张量乘法 4. 矩阵逐元素(Element-wise)乘法 torch.mul() torch.mul(mat1, other 排除在外。 21 2. Autograd自动求导 Function类我们已经知道PyTorch使用动态计算图(DAG)记录计算的全过程,DAG的节点是Function对象，边表示数据依赖，从输出指向输入。因此Function类在PyTorch自动求导中位居核心地位，但是用户通常不会直接去使用。每当对Tensor施加一个运算的时候，就会产生一个Function对象，它产生运算的结

0 码力 | 40 页 | 1.64 MB | 1 年前
3
PyTorch OpenVINO 开发实战系列教程第一篇

自定义算子实现复杂的网络结构，构建一些特殊的网络模型。张量跟算子 / 操作数一起构成了计算图，它们是也是计算图的基本组成要素。 ● 计算图深度学习是基于计算图完成模型构建，实现数据在各个计算图节点之间流动，最终输出，因此计算图又被称为数据流图。根据构建计算图的方式不同还可以分为静态图与动态图， Pytorch 默认是基于动态图的方式构建计算图，动态图采用类似 python 语法，可以随时运行，灵活修改调整；而静态图则 25, 0, 210], [ 65, 220, 93, 11], [133, 102, 64, 230]]) 其中 v1 是直接输出、v2 首先随机初始化种子之后再输出、 v3 是函数 torch.randint 创建的随机数组，它的前面两个值 0 跟 255 表示整数的取值范围为 0~255 之间，最后一个 (4,4) 表示创建 4x4 大小的数组。 tensor([[ 5.8000], [12.4000]]) 上面得代码中 x 是 a 加 b 的结果，y 是 a 加 b 之和与 c 的矩阵乘法的最终输出结果。 ● 数据类型转换在实际的开发过程中，我们经常需要在不同类型的数据张量中切换，因此数据类型转换函数也是必修的，代码演示如下： m = torch.tensor([1.,2.,3.

0 码力 | 13 页 | 5.99 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

在训练过程开始时，我们用随机值初始化这些矩阵。然后我们开始训练过程。在每个训练步骤中，我们采取一个正样本及其相关的负样本。我们来看看我们的第一组： 22 3.Word2Vec 训练流程现在我们有四个单词：输入单词not和输出/上下文单词:( thou实际邻居）,aaron，和taco（负样本）。我们继续查找它们的嵌入 - 对于输入词，我们查看Embedding矩阵。对于上下文单词，我们查看Context矩阵（即使然后，我们计算输入嵌入与每个上下文嵌入的点积。在每种情况下，会产生一个数字，该数字表示输入和上下文嵌入的相似性。 24 3.Word2Vec 训练流程现在我们可以将sigmoid操作的输出视为这些样本的模型输出。您可以看到taco得分最高aaron，并且在sigmoid操作之前和之后仍然具有最低分。既然未经训练的模型已做出预测，并且看到我们有一个实际的目标标签要比较，那么让我们计算模型预测中通过随机Mask(即遮挡)数据库文本中的词语或语段，让神经网络自主学习复原被遮挡部分，从而拥有“猜测”缺失内容的能力，产出预训练模型。再通过大规模预训练模型理解上文或给定条件，从概率层面推测最符合要求的输出结果。其本质是借助超大规模的训练参数猜测上下文的过程文本风格主流思路是分离文本属性及文本内容迁移隐式方法即使用某类无监督学习学习或强化学习模式将文本属性及内容自动分离，常见的有

0 码力 | 44 页 | 2.36 MB | 1 年前
3

共 42 条前往

页

分类

语言

格式