《TensorFlow 快速入门与实战》5-实战TensorFlow手写体数字识别第五部分 实战 TensorFlow 手写体数字识别 扫描二维码 试看/购买《TensorFlow 快速入门与实战》视频课程 • 手写体数字 MNIST 数据集介绍 • MNIST Softmax 网络介绍 • 实战 MNIST Softmax 网络 • MNIST CNN 网络介绍 • 实战 MNIST CNN 网络 第五部分 目录 手写体数字 MNIST 数据集介绍 MNIST MNIST 是一套手写体数字的图像数据集,包含 60,000 个训练样例和 10,000 个测试样例, 由纽约大学的 Yann LeCun 等人维护。 获取 MNIST 数据集 MNIST 手写体数字介绍 MNIST 图像数据集使用形如[28,28]的二阶数组来表示每个手写体数字,数组中 的每个元素对应一个像素点,即每张图像大小固定为 28x28 像素。 MNIST 手写体数字介绍 MNIST 表示 黑色(前景),使用取值为[0,255]的uint8数据类型表示图像。为了加速训练,我 们需要做数据规范化,将灰度值缩放为[0,1]的float32数据类型。 255 0 MNIST 手写体数字介绍 下载和读取 MNIST 数据集 一个曾广泛使用(如 chapter-2/basic-model.ipynb),如今被废弃的(deprecated)方法: 下载和读取 MNIST 数据集0 码力 | 38 页 | 1.82 MB | 1 年前3
QCon2018北京-基于深度学习的视频结构化实践-姚唐仁《基于深度学习的视频结构化实践》 七牛云 AI实验室首席架构师/姚唐仁� • 围绕海量数据提供创新的云服务,帮助客户缩短想法到产品的距离 • 创立6年,每年超过300%的业绩增长 • 已完成5轮融资,累计超过20亿 • 长期服务70多万企业用户和开发者 • 文件数超过2000亿,每日新增文件20亿 • 覆盖全球300个节点 • 覆盖金融、公安、广电媒体、互联网等行业 视觉-最重要的信息感知 2017中国网络视频用户情况 ����2017������������� 传统视频摘要 vs AI视频结构化 内容不完整 依赖经验 实时性差 时效性差 识别范围广 效率高 可迭代 创新基础 传统手工摘要 AI视频结构化 视频结构化场景 视频分解 基础模型要素 ��1�01:02:03-01:10:05� ��1����� �� �� 2 ������ ��PA� ������ 3 4 5 6 ���L ������ ��PA� ����� ���L ��������� ������L 大规模视频训练框架 结构化策略 ���� ������ ���� ���� 主题分类-特征提取 DPN SENet ResNeXt NASNet 主题分类-模型训练 模型融合 a) Early0 码力 | 39 页 | 38.01 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112启了深度学习的第三次复兴之路。 1.2.1 浅层神经网络 1943 年,心理学家 Warren McCulloch 和逻辑学家 Walter Pitts 根据生物神经元(Neuron) 结构,提出了最早的神经元数学模型,称为 MP 神经元模型。该模型的输出?(?) = ℎ(?(?)),其中?(?) = ∑ ?? ? , ?? ∈ {0,1},模型通过?(?)的值来完成输出值的预测,如图 感知机模型 预览版202112 1.2 神经网络发展简史 5 图 1.6 Frank Rosenblatt 和 Mark 1 感知机① 图 1.7 Mark 1 感知机网络结构② 1969 年,美国科学家 Marvin Minsky 等人在出版的《Perceptrons》一书中指出了感知 机等线性模型的主要缺陷,即无法处理简单的异或 XOR 等线性不可分问题。这直接导致 等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从 零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本;自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。 目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡, 图 1.12 例举了从 2008 年到 2017 年 NVIDIA0 码力 | 439 页 | 29.91 MB | 1 年前3
谭国富:深度学习在图像审核的应用Webank身份证识别,主播实名认证: 方便用户快速 的输入证件信息。 SACC2017 OCR识别 – 通用场景和手写 Ø 手写体手机/电话识别准确率可达99%以上。突破业界复杂手写体 识别的难题。 Ø 通用场景准确率和召回率均在88%以上。 Ø 应用场景:快递单据,广告识别等。 l 手写体OCR以及通用OCR识别 l 落地应用: Ø 微云相册识别,广点通广告识别,顺丰快递单据识别,微云文本 识别等 深度学习 - 如何设计网络结构 AlexNet,8层,,I型 VGGNet,19层,I型 GoogleNet,22层,W型 ResNet,152层,V型 3x3, 64 3x3, 64 relu 直线型 (I型) 局部双分支型 (V型) 局部多分支型 (W型) DenseNet Dual Path Network 整体结构:深度大幅增加,宽度适当增加: 局部结构:直线型分支型 稠密连接:分支连接多层连接 • 越来越多的应用场景,云服务,Android,iOS, 闸机嵌入式 • 越来越复杂的限制条件, 内存,功耗,延迟 • 越来越多的数据量,图像从百万到千万,数据从图像到视频 • 越来越复杂的网络结构,从Resnet,ResNeXt,DenseNet,DPN,SENET SACC2017 加快训练速度 - RapidFlow Mysql App 1 master agent agent0 码力 | 32 页 | 5.17 MB | 1 年前3
动手学深度学习 v2.0另一个是更实际的示例,我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如 何工作的,我们就可以在随后的教程中使用高级API了。 内容和结构 全书大致可分为三个部分,在 图1 中用不同的颜色呈现: 目录 3 图1: 全书结构 • 第一部分包括基础知识和预备知识。1节 提供深度学习的入门课程。然后在 2节 中,我们将快速介绍实 践深度学习所需的前提条件,例如如何存储和处理数 network,CNN),这是构成大多数现代计算机视觉系统骨干的强大工具。随后,在 8节 和 9节 中,我们引入了循环神经网络(recurrent neural network,RNN),这是一种利用数据中的时间或序列 结构的模型,通常用于自然语言处理和时间序列预测。在 10节 中,我们介绍了一类新的模型,它采用 了一种称为注意力机制的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将 帮助读者快速 0 + 0.8 × 1 = 0.8。事实上,谨慎是有道理的,图1.3.2中 的蘑菇实际上是一个死帽蕈。 分类可能变得比二项分类、多项分类复杂得多。例如,有一些分类任务的变体可以用于寻找层次结构,层次 结构假定在许多类之间存在某种关系。因此,并不是所有的错误都是均等的。人们宁愿错误地分入一个相关 的类别,也不愿错误地分入一个遥远的类别,这通常被称为层次分类(hierarchical classification)。早期的一0 码力 | 797 页 | 29.45 MB | 1 年前3
全连接神经网络实战. pytorch 版. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1 基本网络结构 11 2.2 使用 cuda 来训练网络 13 3 更完善的神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . pytorch 的,我也开始转战 pytorch。 pytorch 其实更为简单,只是很多教程会一次性给出过多内容,导致读者难以区分什么是必要 的,什么是非必要的。这构成了我写这本书的初衷——从基础到模型结构的步步递进。我们不会 一次性给出一大堆可选择的内容导致学习变得复杂化,而是用到什么就讲什么。本书不可避免要 参考 [2] 的讲解方式,但我们对讲解顺序和内容,以及程序代码都做了大量的改进。说了那么多, 设置 target_transf orm。 前两节的源码参见 chapter1.py。 2. 构建神经网络 2.1 基本网络结构 11 2.2 使用 cuda 来训练网络 13 本章描述如何构建神经网络模型。 2.1 基本网络结构 我们定义神经网络的结构。在 pytorch 中要想使用神经网络,需要继承 nn.Module: c l a s s NeuralNetwork (nn0 码力 | 29 页 | 1.40 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言计算机视觉技术等 安防 中国 2011年 D轮融资 估值40亿美元 8 科大讯飞 智能语音技术 综合 中国 1999年 上市 市值108亿美元 9 Automation Anywhere 自然语言处理技术、非结构化数据认知 企业管理 美国 2003年 B轮融资 估值68亿美元 10 IBM Watson(IBM沃森) 深度学习、智适应学习技术 计算机 美国 1911年 上市 市值1198亿美元 11 松鼠AI ) ✓ 如何将将原高维空间中的数据点映射到低维度的 空间中? 2. 机器学习的类型-无监督学习 18 ✓ 强化学习(Reinforcement Learning) ✓ 用于描述和解决智能体(agent)在与环境的交 互过程中通过学习策略以达成回报最大化或实现 特定目标的问题 。 2. 机器学习的类型-强化学习 19 ✓ 机器学习方法 ✓ 模型 ✓ 损失函数 ✓ 优化算法 “过拟合”的问题。 为此,我们再原有基础上加上用于控制模型复杂度的正则项(Regularizer),得到结构最小化准 则。具体定义是: 其中,?(?)代表对模型复杂度的惩罚。模型越复杂,?(?)越大,模型越简单,?(?)就越小。?是 一个正的常数,也叫正则化系数,用于平衡经验风险和模型复杂度。 一般来说,结构风险小的模型需要经验风险和模型复杂度同时小,因此对训练数据和测试数据 都能有较好的拟合。 机器学习的概念-损失函数0 码力 | 78 页 | 3.69 MB | 1 年前3
机器学习课程-温州大学-02-数学基础回顾-1.CS229-LinearAlgebra中,行列式的值是 (可以使用本节后面显示的公式计算),因此平行四边形的面积为7。(请 自己验证!) 在三维中,集合 对应于一个称为平行六面体的对象(一个有倾斜边的三维框,这样每个面都有一个平 行四边形)。行定义 的 矩阵S的行列式的绝对值给出了平行六面体的三维体积。在更高的维度 中,集合 是一个称为 维平行切的对象。 图1:(4)中给出的 矩阵 的行列式的图示。 这里, 和 是对应于 行的向量,并且集合 应于阴影区域(即,平行四边形)。 这个行列式的绝对值, ,即平行四边形的面积。 在代数上,行列式满足以下三个属性(所有其他属性都遵循这些属性,包括通用公式): 1. 恒等式的行列式为1, (几何上,单位超立方体的体积为1)。 2. 给定一个矩阵 , 如果我们将 中的一行乘上一个标量 ,那么新矩阵的行列式是 几何上,将集合 的一个边乘以系数 ,体积也会增加一个系数 。 3. 如果我们交换任意两行在 和 的特征值,即 。(要证明这一点,取特征向量方程, ,两边都左乘 ) 对角阵的特征值 , 实际上就是对角元素 , 3.13 对称矩阵的特征值和特征向量 通常情况下,一般的方阵的特征值和特征向量的结构可以很细微地表示出来。 值得庆幸的是,在机器学 习的大多数场景下,处理对称实矩阵就足够了,其处理的对称实矩阵的特征值和特征向量具有显着的特 性。 在本节中,我们假设 是实对称矩阵, 具有以下属性:0 码力 | 19 页 | 1.66 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇onv1d、Conv3d)激 活函数、序贯模型 (Sequential)、功能函数 (functional)、损 失功能、支持自定义的模型类(Module)等。通过它们就可 以实现大多数的模型结构搭建与生成。 2)torch.utils 包,里面主要包括训练模型的输入数据处理类、 pytorch 自带的模型库、模型训练时候可视化支持组件、检查 点与性能相关的组件功能。重要的类有数据集类(Dataset) 现在很多开发者喜欢使用 Ubuntu 开发系统,在 Ubuntu 系统 下如下正确安装与配置 Pytorch,第一步同样是安装 python 语言依赖包 Python3.6,主要是执行一系列的安装命令行,具 体步骤如下: 1. 导入第三方软件仓库 sudo add-apt-repository ppa:jonathonf/python-3.6 2. 更新与安装 python3.6 sudo apt-get Pytorch 基础术语与概念 很多人开始学习深度学习框架面临的第一个问题就是专业术语 理解跟基本的编程概念与传统面向对象编程不一样,这个是初 学者面临的第一个学习障碍。在主流的面向对象编程语言中, 结构化代码最常见的关键字是 if、else、while、for 等关键字, 而在深度学习框架中编程模式主要是基于计算图、张量数据、 自动微分、优化器等组件构成。面向对象编程运行的结果是交 互式可视0 码力 | 13 页 | 5.99 MB | 1 年前3
Keras: 基于 Python 的深度学习库. . . . . . . . . . . . . . . . . . . . . . . . 28 3.3.6.1 保存/加载整个模型(结构 + 权重 + 优化器状态) . . . . . . . . . 28 3.3.6.2 只保存/加载模型的结构 . . . . . . . . . . . . . . . . . . . . . . . . 29 3.3.6.3 只保存/加载模型的权重 Python 代码中,这 些代码紧凑,易于调试,并且易于扩展。 1.3 快速开始:30 秒上手 Keras Keras 的核心数据结构是 model,一种组织网络层的方式。最简单的模型是 Sequential 顺 序模型,它是由多个网络层线性堆叠的栈。对于更复杂的结构,你应该使用 Keras 函数式 API, 它允许构建任意的神经网络图。 Sequential 顺序模型如下所示: from 3.2.3 所有的模型都可调用,就像网络层一样 利用函数式 API,可以轻易地重用训练好的模型:可以将任何模型看作是一个层,然后通过 传递一个张量来调用它。注意,在调用模型时,您不仅重用模型的结构,还重用了它的权重。 x = Input(shape=(784,)) # 这是可行的,并且返回上面定义的 10-way softmax。 y = model(x) 快速开始 18 这种方式0 码力 | 257 页 | 1.19 MB | 1 年前3
共 50 条
- 1
- 2
- 3
- 4
- 5













