【PyTorch深度学习-龙龙老师】-测试版202112NVIDIA GPU 和 Google TPU 等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从 零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本;自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。 目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡, 图 1.12 例举了从 型可以在相同的算法、模型结构和超参数的设定下,在 49 个游戏上获得人类相当的游戏水 平,呈现出一定程度的通用智能。图 1.14 是 DQN 算法的网络结构,它并不是针对于某个 游戏而设计的,而是可以控制 Atria 游戏平台上的 49 个游戏。 图 1.14 DQN 算法网络结构示意图 [1] 1.4 深度学习应用 深度学习算法已经广泛应用到人们生活的角角落落,例如手机中的语音助手、汽车上 超越多名人类围棋专家;在 Dota2 和星际争霸游戏上,OpenAI 和 DeepMind 开发的智能程 序也在限制规则下战胜了顶级职业队伍。 机器人(Robotics) 在真实环境中,机器人的控制也取得了一定的进展。如 UC Berkeley 实验室在机器人领域的 Imitation Learning、Meta Learning、Few-shot Learning 等方向上取得 了不少进展0 码力 | 439 页 | 29.91 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波支持百亿特征维度,千亿参数 • 模型版本 • 多模型多版本:多组实验并行执行,提高实验迭代效率 • 在线版本切换:基于ZK的版本感知机制,动态进行版本切换,实现BASE模型的热更新,实时训练与离线训练周期模型融合 • 模型结构训练与推理兼容:在线PS与离线PS模型结构兼容,自动模型参数转换 • 稳定性优化 • 模型快照:基于ps-scheduler的周期模型版本探测与保存,模型稀疏化分片存储 实时训练 模型训练 模型部署 在线服务 离线验证 在线发布 在线验证 在线一致性/ 模型稳定性/… 一键打包 端口探测 蓝绿部署/灰度发布 AUC/准确率/ 召回率/… 流量切换 版本更新 全量发布 … verson1 verson2 … kubenetes/olsubmit 模型库 3 在线机器学习-模型服务部署 • 模型评估 • 模型上线部署前指标评估 • 深度学习-深度学习模型训练 • 分布式模型推理框架:WeiServing 异构CPU集群 kubernetes/ol-submit RPC服务框架 LR/GBDT DNN/DeepFM/W&D 负载均衡/统一版本管理/动态加载/批量化机制 特征映射 Embedding 数据处理 异构GPU集群 CNN 业务应用 模型服务 框架 排序模型服务 多媒体分析服务 自然语言分析服务 集群调度层 核心架构层0 码力 | 36 页 | 16.69 MB | 1 年前3
动手学深度学习 v2.0分离计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.4 Python控制流的梯度计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.6 概率 . . . . . . . . . 这本书将从头开始教授深度学习的概念。有时,我们想深入研究模型的细节,这些的细节通常会被深度学习 框架的高级抽象隐藏起来。特别是在基础教程中,我们希望读者了解在给定层或优化器中发生的一切。在这 些情况下,我们通常会提供两个版本的示例:一个是我们从零开始实现一切,仅依赖张量操作和自动微分; 另一个是更实际的示例,我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如 何工作的,我们就可以在随后的教程中使用高级API了。 管我们尽了最大努 力,但仍然缺乏对各种技术的正式解释,这既是因为描述这些模型的数学可能非常困难,也是因为对这些主 题的认真研究最近才进入高潮。我们希望随着深度学习理论的发展,这本书的未来版本将能够在当前版本无 法提供的地方提供见解。 有时,为了避免不必要的重复,我们将本书中经常导入和引用的函数、类等封装在d2l包中。对于要保存到包 中的任何代码块,比如一个函数、一个类或者多个导入,我们都会标记为#@save。我们在0 码力 | 797 页 | 29.45 MB | 1 年前3
Keras: 基于 Python 的深度学习库© 2018 by Keras-Team 前 言 整理 Keras: 基于 Python 的深度学习库 PDF 版的主要原因在于学习 Keras 深度学习库时方 便本地查阅,下载最新 PDF 版本请访问: https://github.com/wanzhenchn/keras-docs-zh。 感谢 keras-team 所做的中文翻译工作,本文档制作基于此处。 严正声明:本文档可免费用 化,可扩展性)。 • 同时支持卷积神经网络和循环神经网络,以及两者的组合。 • 在 CPU 和 GPU 上无缝运行。 查看文档,请访问 Keras.io。 Keras 兼容的 Python 版本: Python 2.7-3.6。 1.2 指导原则 • 用户友好。Keras 是为人类而不是为机器设计的 API。它把用户体验放在首要和中心位置。 Keras 遵循减少认知困难的最佳实践:它提供一致且简单的 optimizer='sgd', metrics=['accuracy']) 如果需要,你还可以进一步地配置你的优化器。Keras 的核心原则是使事情变得相当简单, 同时又允许用户在需要的时候能够进行完全的控制(终极的控制是源代码的易扩展性)。 model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers0 码力 | 257 页 | 1.19 MB | 1 年前3
AI大模型千问 qwen 中文文档generation, vision understanding, audio understanding, tool use, role play, playing as AI agent, etc. 最新版本 Qwen1.5 有以下特点: • 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B; • 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。 我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。 1.1.1 Pip 安装 pip install transformers -U 1.1.2 Conda 安装 conda install conda-forge::transformers 从源码安装 pip install git+https://github.com/huggingface/transformers 我们建议您使用 Python3.8 及以上版本和 Pytorch 2.0 及以上版本。 3 Qwen 1.2 快速开始 本指南帮助您快速上手 Qwen1.5 的使用,并提供了如下示例:Hugging Face Transformers 以及 ModelScope0 码力 | 56 页 | 835.78 KB | 1 年前3
TensorFlow on Yarn:深度学习遇上大数据example.com:2222” ], “ps”: [ “ps0.example.com:2222”, “ps1.example.com:2222” ]}) 分布式版本ClusterSpec定义:� 带来的问题:� • ⼿动指定机器很繁琐� • 端⼝冲突� • 机器负载不均� TensorFlow使用现状及痛点 • ⼿动分发训练样本� • ⼿动拉取训练模型� 支持GPU亲和性调度(提⾼通信效率)� • Web的⽅式查看作业的运⾏状况和作业日志� • 在线查看Tensorboard� • HistoryServer支持查看结束作业的日志和状态信息� • 控制已有的TensorFlow作业的迁移成本(最多改三⾏ 代码)� 扩展目标:� TensorFlow on Yarn设计 tensorflow-submit \� --app-name --board-enable true \ #是否开启Tensorboard服务� --conf tf.file.download.thread.nums=10 #其他参数设置� 提交脚本示例(分布式版本):� TensorFlow on Yarn设计 Yarn首页作业信息:� 作业类型 集群GPU资源概况 作业分配到的GPU数量 TensorFlow on Yarn设计 TensorFlow作业AM页面:�0 码力 | 32 页 | 4.06 MB | 1 年前3
谭国富:深度学习在图像审核的应用建筑、动植物、食物等9个大类 。 Ø 技术指标:20个类别平均准确率MAP>90%以上,200种MAP>63%以上, 性能CPU上约200ms/张。 微云相册,相册管家 识别标签效果 Ø 微云,相册管家新版本推出智能全自动图片分类,通过上百 种常用图片标签,实现对所有照片的自动识别分类。 Ø 用户上传图片之后即可被智能分类,各大类下包括小类如人 物大类下有合影、女孩、男孩、聚会等小标签。只需要输入 一键生成深度学习SDK,一个模型到处应用 加快应用速度 - RapidNet Ncnn : 移动端前向网络开源框 https://github.com/tencent/ncnn • 针对移动端优化版本 • 开源建设, 2.6k+ stars SACC2017 从静到动:结合视频识别能力 从图像到声音: 音频识别 03 图像内容审核的扩展和延伸 优图-腾讯云 天御内容识别解决方案 Deep 预测: 113.4人 • 结合视频监控场景, 在图像序列中, 识别图 像物体, 识别人体,人群密度,人体属性等 各种信息 • 融合图像,动作识别能力,提升审核准确率, 召回率, 增加更多场景风险控制 SACC2017 从图像到声音: 音频识别 声纹识别 小语种声音分类 l 优图原音音频识别系统 QQ 音乐- 音乐检索 SACC2017 腾讯优图 部分合作伙伴 南宁公安 福建公安0 码力 | 32 页 | 5.17 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言当样本数量足够大时,根据大数定理,经验风险会近似于模型的期望风险。此时,经验风险最 小化能确保有好的学习性能。然而,当样本数量不足时,单单利用经验风险最小化可能会导致 “过拟合”的问题。 为此,我们再原有基础上加上用于控制模型复杂度的正则项(Regularizer),得到结构最小化准 则。具体定义是: 其中,?(?)代表对模型复杂度的惩罚。模型越复杂,?(?)越大,模型越简单,?(?)就越小。?是 一个正的常数 com/p/59027692 3. 机器学习的背景知识-Python基础 51 Python 的环境的安装 ⚫Anaconda https://www.anaconda.com/distribution/ 通常选3.7版本,64位 可以用默认安装,右图两个选择框都勾上 52 Python 的环境的安装 ⚫Jupyter notebook 在cmd环境下,切换到代码的 目录,输入命令: jupyter notebook之后就可以 ⚫字典(dict) 字典dict也叫做关联数组,用大括号{ }括起来,在其他语言中也称为map,使用键-值( key-value)存储,具有极快的查找速度,其中key不能重复。 56 Python控制流 ⚫顺序结构 ⚫分支结构 ⚫循环结构 ⚫break、continue和pass ⚫列表生成式 57 Python函数 ⚫调用函数 调用内置函数 ⚫定义函数 def 函数名():0 码力 | 78 页 | 3.69 MB | 1 年前3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒使用模型压缩算法,在基本保障准确率的情况下大幅提升速度 - 利用最新的硬件特性,如GPU TensorCore/int8 *示意图来自互联网 Kubernetes在异构系统调度中的挑战 • Kubernetes版本发布快,新特性更新频繁,对异构调度的支持不断加强;但配套设施落后(e.g. Spark on K8s, GitlabCI) • 容器系统调用栈深,需要仔细验证操作系统,内核及异构设备驱动的兼容性 完善的配套工具,如go test, gofmt, go lint, race-detector Go语言在高性能系统中的实践经验 • Go在开发高性能应用上也有一些不足, 对比C++: - 无法直接控制操作系统线程,CUDA 调用需要特殊处理 - 部分标准库实现依赖reflect,性能较 差 - GC的带来的开销,如在Go Heap上 构建百万以上级别的对象缓存,需要 仔细优化 百倍慢于等价的C实现!0 码力 | 23 页 | 9.26 MB | 1 年前3
全连接神经网络实战. pytorch 版的能力。此时,最好的方法就是给我们一个由简及难的程序示例,我们能够快速搭建出一个网络, 我们可以开始训练,以及指导如何计算训练后的结果准确率等信息。 这也是我要开始写这么一本小书的初衷,我会把本小书控制在 3 小时的学习时间之内。也就 是说,只知道一丁点 python 知识和神经网络的概念,而从未使用过 pytorch 的读者,只需要三个 小时,就可以用 pytroch 搭建一个有模有样的神经网络系统了。 20211006:完成本书第一版。 5 1. 准备章节 1.1 导入 pytorch 6 1.2 导入样本数据 7 本章节将神经网络训练之前的准备工作进行全面介绍。但我们并不介绍如何安装 pytorch,一是由 于不同版本的 pytorch 会依赖于不同的 cuda 工具,二是因为官网资料非常齐全,也有很多博客来 介绍,因此没有必要赘述。 1.1 导入 pytorch 首先我们需要明白一个术语:tensor。这个词被翻译为中文叫张量。10 码力 | 29 页 | 1.40 MB | 1 年前3
共 30 条
- 1
- 2
- 3













