AI大模型千问 qwen 中文文档generation, vision understanding, audio understanding, tool use, role play, playing as AI agent, etc. 最新版本 Qwen1.5 有以下特点: • 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B; • 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。 我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。 1.1.1 Pip 安装 pip install transformers -U 1.1.2 Conda 安装 conda install conda-forge::transformers 从源码安装 pip install git+https://github.com/huggingface/transformers 我们建议您使用 Python3.8 及以上版本和 Pytorch 2.0 及以上版本。 3 Qwen 1.2 快速开始 本指南帮助您快速上手 Qwen1.5 的使用,并提供了如下示例:Hugging Face Transformers 以及 ModelScope0 码力 | 56 页 | 835.78 KB | 1 年前3
微博在线机器学习和深度学习实践-黄波支持百亿特征维度,千亿参数 • 模型版本 • 多模型多版本:多组实验并行执行,提高实验迭代效率 • 在线版本切换:基于ZK的版本感知机制,动态进行版本切换,实现BASE模型的热更新,实时训练与离线训练周期模型融合 • 模型结构训练与推理兼容:在线PS与离线PS模型结构兼容,自动模型参数转换 • 稳定性优化 • 模型快照:基于ps-scheduler的周期模型版本探测与保存,模型稀疏化分片存储 实时训练 模型训练 模型部署 在线服务 离线验证 在线发布 在线验证 在线一致性/ 模型稳定性/… 一键打包 端口探测 蓝绿部署/灰度发布 AUC/准确率/ 召回率/… 流量切换 版本更新 全量发布 … verson1 verson2 … kubenetes/olsubmit 模型库 3 在线机器学习-模型服务部署 • 模型评估 • 模型上线部署前指标评估 • DSSM/FM/FF M生成博主与物 料向量,采用 向量进行召回 特征向量化:Item2vec 向量索引:FM/FFM/ DSSM 模型召回:DIN/DIEN/TDM 模型召回 融入用户近期互动行 为的深度模型召回 单目标:LR->W&D->FM->DeepFM 多目标:点击FM+互动FM 排序损失:DeepFM+Pair-Wise Rank Loss 多目标 融合点击模型和 互动模型0 码力 | 36 页 | 16.69 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇开发者生态社区,因为其开发效率高、特别容 易构建各种复杂的深度学习模型网络,因此很快得到大量人工 智能开发者的认可与追捧,也成为工业界最受欢迎的深度学习 框架之一。 Pytorch 发展至今,其版本跟功能几经迭代,针对不同的场景 任务分裂出不同的分支扩展库,比如针对自然语言处理(NLP) 的 torchtext、针对计算机视觉的 torchvision、针对语音处理 的 torchaud iOS 移动端部署。 在版本发布管理方面,Pytorch 分为三种不同的版本分别是稳 定版本 (Stable Release)、Beta 版本、原型版本(Prototype)。 其中稳定版本长期支持维护没有明显的性能问题与缺陷,理论 上支持向后兼容的版本;Beta 版本是基于用户反馈的改动版 本,可能有 API/SDK 函数改动,性能有进一步需要提升的空间; 原型版本是新功能还不可以,需要开发不能通过 数与模型构 建在短时间内吸引了大量学术研究者与工业界开发者的追捧。 当前无论是在学术界还是工业界 Pytorch 已经是主流深度学习 框架之一,而且大有后来居上之势,因此随着人工智能赋能各 行各业,Pytorch 框架必然会更加得到开发者的青睐,成为人 工智能 (AI) 开发者必备技能之一。同时 Pytorch 也会在部署跟 推理方面会更加完善与方便,加强支持移动端,嵌入式端等应 用场景,相信掌握0 码力 | 13 页 | 5.99 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112NVIDIA GPU 和 Google TPU 等并行加速芯片训练模型参数。如围棋程序 AlphaGo Zero 在 64 块 GPU 上从 零开始训练了 40 天才得以超越所有的 AlphaGo 历史版本;自动网络结构搜索算法使用了 800 块 GPU 同时训练才能优化出较好的网络结构。 目前普通消费者能够使用的深度学习加速硬件设备主要来自 NVIDIA 的 GPU 显卡, 图 1.12 例举了从 合其它类型的神经网络的应用。Caffe 的主要开发语言是 C++,也提供 Python 语言等 接口,支持 GPU 和 CPU。由于开发时间较早,在业界的知名度较高,2017 年 Facebook 推出了 Caffe 的升级版本 Cafffe2,Caffe2 目前已经融入到 PyTorch 库中。 ❑ Torch 是一个非常优秀的科学计算库,基于较冷门的编程语言 Lua 开发。Torch 灵活性 较高,容易实现自定义网络层,这也是 年发布的深度学习框架,最初版本只支持符号式编程。 得益于发布时间较早,以及 Google 在深度学习领域的影响力,TensorFlow 很快成为最 流行的深度学习框架。但是由于 TensorFlow 接口设计频繁变动,功能设计重复冗余, 符号式编程开发和调试非常困难等问题,TensorFlow 1.x 版本一度被业界诟病。2019 年,Google 推出 TensorFlow 2 正式版本,将以动态图优先模式运行,从而能够避免0 码力 | 439 页 | 29.91 MB | 1 年前3
动手学深度学习 v2.0这本书将从头开始教授深度学习的概念。有时,我们想深入研究模型的细节,这些的细节通常会被深度学习 框架的高级抽象隐藏起来。特别是在基础教程中,我们希望读者了解在给定层或优化器中发生的一切。在这 些情况下,我们通常会提供两个版本的示例:一个是我们从零开始实现一切,仅依赖张量操作和自动微分; 另一个是更实际的示例,我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如 何工作的,我们就可以在随后的教程中使用高级API了。 管我们尽了最大努 力,但仍然缺乏对各种技术的正式解释,这既是因为描述这些模型的数学可能非常困难,也是因为对这些主 题的认真研究最近才进入高潮。我们希望随着深度学习理论的发展,这本书的未来版本将能够在当前版本无 法提供的地方提供见解。 有时,为了避免不必要的重复,我们将本书中经常导入和引用的函数、类等封装在d2l包中。对于要保存到包 中的任何代码块,比如一个函数、一个类或者多个导入,我们都会标记为#@save。我们在 本书中的大部分代码都是基于PyTorch的。PyTorch是一个开源的深度学习框架,在研究界非常受欢迎。本书 中的所有代码都在最新版本的PyTorch下通过了测试。但是,由于深度学习的快速发展,一些在印刷版中代 码可能在PyTorch的未来版本无法正常工作。但是,我们计划使在线版本保持最新。如果读者遇到任何此类 问题,请查看安装 (page 9) 以更新代码和运行时环境。 下面是我们如何从PyTorch导入模块。0 码力 | 797 页 | 29.45 MB | 1 年前3
Keras: 基于 Python 的深度学习库© 2018 by Keras-Team 前 言 整理 Keras: 基于 Python 的深度学习库 PDF 版的主要原因在于学习 Keras 深度学习库时方 便本地查阅,下载最新 PDF 版本请访问: https://github.com/wanzhenchn/keras-docs-zh。 感谢 keras-team 所做的中文翻译工作,本文档制作基于此处。 严正声明:本文档可免费用 化,可扩展性)。 • 同时支持卷积神经网络和循环神经网络,以及两者的组合。 • 在 CPU 和 GPU 上无缝运行。 查看文档,请访问 Keras.io。 Keras 兼容的 Python 版本: Python 2.7-3.6。 1.2 指导原则 • 用户友好。Keras 是为人类而不是为机器设计的 API。它把用户体验放在首要和中心位置。 Keras 遵循减少认知困难的最佳实践:它提供一致且简单的 y_train, epochs=5, batch_size=32) 或者,你可以手动地将批次的数据提供给模型: model.train_on_batch(x_batch, y_batch) 只需一行代码就能评估模型性能: loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128) 或者对新的数据生成预测: classes0 码力 | 257 页 | 1.19 MB | 1 年前3
机器学习课程-温州大学-13深度学习-TransformerTransformer通过成功地将其应用于具有大量和有限训 练数据的分析,可以很好地推广到其他任务 ◼ Transformer,它完全基于注意力机制, 完全不用重复 和卷积,因而这些模型在质量上更优,同时更易于并 行化,并且需要的训练时间明显更少。 ◼ Transformer出现以后,迅速取代了RNN系列变种,跻 身主流模型架构基础。(RNN缺陷正在于流水线式的 顺序计算) 图:Transformer模型架构 Transformer的工作流程 通过矩阵运算实现自注意力机制 第一步是计算查询矩阵、键矩阵和值矩阵。为此,我们将 将输入句子的词嵌入装进矩阵X中,将其乘以我们训练的权 重矩阵(WQ,WK,WV)。 x矩阵中的每一行对应于输入句子中的一个单词。我 们再次看到词嵌入向量 (512,或图中的4个格子)和 q/k/v向量(64,或图中的3个格子)的大小差异。 最后,由于我们处理的是矩阵,我们可以用一个公式 来计算自注意力层的输出。 如果我们假设词嵌入的维数为4,则实际的位置编码如下: 35 2.Transformer的工作流程 图中,每一行对应一个词向量的位置编码,所以第一行对应着输入 序列的第一个词。每行包含512个值,每个值介于1和-1之间。我们 已经对它们进行了颜色编码,所以图案是可见的。 20字(行)的位置编码实例,词嵌入 大小为512(列)。你可以看到它从中 间分裂成两半。这是因为左半部分 的值由一个函数(使用正弦)生成,0 码力 | 60 页 | 3.51 MB | 1 年前3
TensorFlow on Yarn:深度学习遇上大数据example.com:2222” ], “ps”: [ “ps0.example.com:2222”, “ps1.example.com:2222” ]}) 分布式版本ClusterSpec定义:� 带来的问题:� • ⼿动指定机器很繁琐� • 端⼝冲突� • 机器负载不均� TensorFlow使用现状及痛点 • ⼿动分发训练样本� • ⼿动拉取训练模型� --board-enable true \ #是否开启Tensorboard服务� --conf tf.file.download.thread.nums=10 #其他参数设置� 提交脚本示例(分布式版本):� TensorFlow on Yarn设计 Yarn首页作业信息:� 作业类型 集群GPU资源概况 作业分配到的GPU数量 TensorFlow on Yarn设计 TensorFlow作业AM页面:� 启动Tensorboard服务:� TensorFlow on Yarn技术细节揭秘 降低已有tensorflow程序迁移成本:� (1)单机模式 不需要修改代码 (2)分布式模式(最多修改三行代码) cluster = !.train.ClusterSpec(json.loads(os.environ[“TF_CLUSTER_DEF”])) job_name = os.environ[“TF_ROLE”]0 码力 | 32 页 | 4.06 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言行列式的某一行(列)的所有的元素都乘以 同一数?,等于用数?乘此行列式。 ⚫ ? ∈ ℝ?×?, det(?) = det(?T). ⚫ ?, ? ∈ ℝ?×?, det(??) = det(?)det(?) ⚫ 当且仅当?为奇异方阵时,det(?) = 0 ⚫ 当?为非奇异方阵时,det(?−1) = 1/det(?) 39 线性代数-矩阵 矩阵:? × ?个数???排成?行?列的表格 为正交阵,数学描述为?T? = ? = ??T。 正定性 对于 ? ∈ ℝ?×?, ∀? ∈ ℝ?×1,满足 ?T?? > 0, A为正定矩阵; ?T?? ≥ 0,?为半正定矩阵。 42 线性代数 行列式按行(列)展开定理 (1) 设? = ??? ?×?,则:??1??1 + ??2??2 + ⋯ + ?????? = ቊ ? , ? = ? 0, ? ≠ ? 或?1??1? + ?2??2? + ⋯ com/p/59027692 3. 机器学习的背景知识-Python基础 51 Python 的环境的安装 ⚫Anaconda https://www.anaconda.com/distribution/ 通常选3.7版本,64位 可以用默认安装,右图两个选择框都勾上 52 Python 的环境的安装 ⚫Jupyter notebook 在cmd环境下,切换到代码的 目录,输入命令: jupyter notebook之后就可以0 码力 | 78 页 | 3.69 MB | 1 年前3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒TensorCore/int8 *示意图来自互联网 Kubernetes在异构系统调度中的挑战 • Kubernetes版本发布快,新特性更新频繁,对异构调度的支持不断加强;但配套设施落后(e.g. Spark on K8s, GitlabCI) • 容器系统调用栈深,需要仔细验证操作系统,内核及异构设备驱动的兼容性 • Kubernetes对NUMA、异构计算、存储设备的调度能力待加强 1 回顾 • 智慧城市中,在智能安防领域机器视觉有着爆发式应用 • 我们使用基于深度学习的机器视觉技术,构建了超大规模的自我演化 的分布式智能系统 • 在构建这个规模的系统中,我们广泛使用了Kubernetes、Go等流行技 术,“那些年踩过的坑”0 码力 | 23 页 | 9.26 MB | 1 年前3
共 46 条
- 1
- 2
- 3
- 4
- 5













