端到端模型 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

AI大模型千问 qwen 中文文档

AI agent, etc. 最新版本 Qwen1.5 有以下特点： • 6 种模型规模，包括 0.5B、1.8B、4B、7B、14B 和 72B； • 针对每种尺寸提供基础模型和 Chat 模型，并确保聊天模型按照人类偏好进行校准； • 对基础模型和 Chat 模型的多语言支持 • 基础模型和聊天模型都支持多种语言； • 支持工具调用、RAG（检索增强文本生成）、角色扮演、AI Agent 快速开始 CHAPTER1 文档 1.1 安装要快速上手 Qwen1.5，您可以从 Hugging Face 安装 transformers 库，并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库，或者至少安装 4.37.0 版本。 1.1.1 Pip 安装 pip install transformers -U 1.1.2 Conda 5，我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4. 37.0 版本。以下是一个非常简单的代码片段示例，展示如何运行 Qwen1.5-Chat 模型，其中包含 Qwen1. 5-7B-Chat 的实例： from transformers import AutoModelForCausalLM, AutoTokenizer device = "cuda"

0 码力 | 56 页 | 835.78 KB | 1 年前
3
机器学习课程-温州大学-11深度学习-序列模型

2023年05月深度学习-序列模型黄海广副教授 2 03 长短期记忆(LSTM) 04 双向循环神经网络本章目录 01 序列模型概述 02 循环神经网络(RNN) 05 深层循环神经网络 3 03 长短期记忆(LSTM) 04 双向循环神经网络 1.序列模型概述 01 序列模型概述 02 循环神经网络(RNN) 循环神经网络(RNN) 05 深层循环神经网络 4 1.序列模型概述循环神经网络（RNN）之类的模型在语音识别、自然语言处理和其他领域中引起变革。 5 数学符号在这里?<1>表示Harry这个单词，它就是一个第 4075行是1，其余值都是0的向量（上图编号1所示），因为那是Harry在这个词典里的位置。 ?<2>是第6830行是1，其余位置都是0的向量（上图编号2所示）。同一层节点之间无关联，从而导致获取时序规则方面功能不足  循环神经网络可以解决时序问题  基于语言模型（LM），故可以捕捉时序规则信息  它是如何实现的？ 7 03 长短期记忆(LSTM) 04 双向循环神经网络 2.循环神经网络(RNN) 01 序列模型概述 02 循环神经网络(RNN) 05 深层循环神经网络 8 2.循环神经网络(RNN)

0 码力 | 29 页 | 1.68 MB | 1 年前
3
李东亮：云端图像技术的深度学习模型与应用

云端图像技术的深度学习模型与应用李东亮 360 人工智能研究院 lidongliang@360.cn 2017.10.20 SACC2017 360电脑安全产品月活跃数达到4.42亿 360手机安全产品移动端用户总数已达约1.49亿 360浏览器月活跃用户数量为3.03亿 360导航日均独立访问用户为8900万人日均点击量约为4.51亿次 360搜索稳定拥有35%以上的市场份额云端移动端业务视觉感知模型 SACC2017 视觉感知核心问题 Object Segmentation Object Classification Person, Horse, Barrier, Table, etc Object Detection 检测识别分割跟踪核心 SACC2017 图像技术的三个核心难点>>小、快、准小模型线上速度快预测准 Frequent remote upgrade CPU-constrained, real-time Cloud processing SACC2017 视觉感知模型分割 Forward Block Forward Block deconvolution deconvolution convolution convolution 检测 Forward Block

0 码力 | 26 页 | 3.69 MB | 1 年前
3
《TensorFlow 2项目进阶实战》2-快速上手篇：动⼿训练模型和部署服务

扫码试看/订阅《TensorFlow 2 项目进阶实战》视频课程快速上手篇：动⼿训练模型和部署服务 • TensorFlow 2 开发环境搭建 • 使用 tf.keras.datasets 加载数据 • 使用 tf.data.Dataset 加载数据 • 使用 tf.keras.Model 管理模型 • Fashion MNIST 数据集介绍 • 使用 TensorFlow 2 训练分类网络 from_generator 加载 Generator 使用 tf.data.TextLineDataset 加载文本 “Hello TensorFlow” Try it！使用 tf.keras.Model 管理模型历史上的 tf.keras.Model • Class tf.compat.v1.keras.Model • Class tf.compat.v1.keras.models.Model • Model • Class tf.keras.models.Model 使用 tf.keras.Model 构建模型使用 tf.keras.Model 构建模型使用 tf.keras.Model 训练模型保存和加载 h5 模型保存和加载 SavedModel 模型 Fashion MNIST 数据集介绍 Original MNIST dataset The MNIST database

0 码力 | 52 页 | 7.99 MB | 1 年前
3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

从推荐模型的基础特点看  袁镱腾讯个⼈简介 � ⽆量系统 � 项⽬于17年启动，先后经过了6个主要版本的迭代 � 覆盖腾讯PCG全部业务的推荐场景，⽀持腾讯 IEG，CSIG，QQ⾳乐，阅⽂等业务的部分推荐场景 � 袁镱博⼠，专家⼯程师 � 研究⽅向：机器学习系统，云计算，⼤数据系统 � 负责腾讯平台与内容事业群（PCG）技术中台核⼼引擎：⽆量系统。⽀持⼤规模稀疏模型训练， �推荐场景深度学习系统的基本问题与特点 �推荐类模型的深度学习系统设计 � 系统维度 � 算法维度 �总结基于深度学习模型的推荐流程，场景与⽬标 Serving系统 HDFS 数据通道训练系统召回业务服务排序混排模型管理上线管理⽆量 RGW/Cos/ kafka 样本存储实时样本⽣成服务离线样本⽣成任务数据通道特征处理模型登记模型上线预测 QQ⼩世界等） � 腾讯系内容推荐：阅⽂集团，QQ⾳乐 � Facebook推荐场景推理成本占AI推理成本的 >72% [ISCA2020 RecNMP] � 千亿级推荐模型应⽤ O1. 千亿级特征（TB级）的模型的在线/离线训练，在线推理服务和持续上线 O2. 针对推荐特点的深度优化，达到业界先进⽔平推荐系统的核⼼特点 � Feature 1（基本特点） 1.1 User与推荐系统交互，7*24⼩时

0 码力 | 22 页 | 6.76 MB | 1 年前
3
QCon北京2018-《从键盘输入到神经网络--深度学习在彭博的应用》-李碧野

Technologies Automation Xiangqian Yu Team Lead, Derivatives Data From Keyboards to Neural Networks 从键盘到神经网络 © 2018 Bloomberg Finance L.P. All rights reserved. What is Bloomberg? The Bloomberg Terminal

0 码力 | 64 页 | 13.45 MB | 1 年前
3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文

Processing 自然语言处理目的：让机器理解人类的语言，是人工智能领域的重要分支，用于分析、理解和生成自然语言，方便人机交流应用：智能问答，机器翻译，文本分类，文本摘要，标签提取，情感分析，主题模型 NLP发展简史 1950S 1980s 1990s 2006~至今以机器翻译为开端，作为早期尝试，但不是很成功基于统计机器学习技术及语料库，使用统计模型，NLP发展产生革新深度学习例如CNN、RNN等机器学习例如Logistics Regression AI 例如Knowledge Base 标准机器学习过程标注数据机器学习算法数据已训练模型预测训练预测深度学习和传统机器学习输入数据深度学习算法输入数据特征工程传统机器学习算法非常耗费时间以文本分类过程举例，常见的特征提取算法包括：词频 TF-IDF 预处理输出层表示层隐层不同深度学习模型后处理 NER 分词情感分析文本分类机器翻译 … 文本分类传统机器学习 • 选择分类器（朴素贝叶斯，SVM，KNN，LR，决策树） • 特征工程构造特征 • 不同领域定制优化成本高 • 常需要分类算法融合提升效果深度学习（CNN，RNN等） • 端到端，无需大量特征工程 • 框架通用性好，满足多领域需求

0 码力 | 46 页 | 25.61 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

预览版202112 预览版202112 前言这是一本面向人工智能，特别是深度学习初学者的书，本书旨在帮助更多的读者朋友了解、喜欢并进入到人工智能行业中来，因此作者试图从分析人工智能中的简单问题入手，一步步地提出设想、分析方案以及实现方案，重温当年科研工作者的发现之路，让读者身临其境式的感受算法设计思想，从而掌握分析问题、解决问题的能力。这种方式也是对读者的基础要求较少的，读者地了解算法的相关背景知识，体会到知识是为了解决问题而生的，避免陷入为了学习而学习的窘境。尽管作者试图将读者的基础要求降到最低，但是人工智能不可避免地需要使用正式化的数学符号推导，其中涉及到少量的概率与统计、线性代数、微积分等数学知识，一般要求读者对这些数学知识有初步印象或了解即可。比起理论基础，读者需要有少量的编程经验，特别是 Python 语言编程经验，显得更加重要，因为本书更侧重于实用性，而不是堆砌公式。部分，主要介绍 PyTorch 相关基础，为后续算法实现铺垫；第 6~9 章为第 3 部分，主要介绍神经网络的核心理论和共性知识，让读者理解深度学习的本质；第 10~15 章为模型算法应用部分，主要介绍常见的算法与模型，让读者能够学有所用。在本书中编写时，很多英文词汇尚无法在业界找到一个共识翻译名，因此作者备注翻译的英文原文，供读者参考，同时也方便读者日后阅读相关英文文献时，不至于感到陌生。

0 码力 | 439 页 | 29.91 MB | 1 年前
3
PyTorch OpenVINO 开发实战系列教程第一篇

Pytorch 介绍与基础知识 1.1 Pytorch 介绍 Pytorch 是开放源代码的机器学习框架，目的是加速从研究原型到产品开发的过程。其 SDK 主要基于 Python 语言，而 Python 语言作为流行的人工智能开发语言一直很受研究者与开发者的欢迎。其模型训练支持CPU与GPU、支持分布式训练、云部署、针对深度学习特定领域有不同的丰富的扩展库。 1.1.1 Pytorch 历史历史 Pytorch 在 2016 年由 facebook 发布的开源机器学习（深度学习）框架，Pytorch 最初的来源历史可以追溯到另外两个机器学习框架，第一个是 torch 框架，第二个是 Chainer，实现了 Eager 模式与自动微分，Pytoch 集成了这两个框架的优点，把 Python 语言作为框架的首选编程语言，所以它的名字是在 torch 的前面加上 Py 构建各种深度学习模型并实现分布式的训练，因此一发布就引发学术界的追捧热潮，成为深度学习研究者与爱好者的首选开发工具。在 pytorch 发布之后两年的 2018 年 facebook 又把 caffe2 项目整合到 pytorch 框架中，这样 pytorch 就进一步整合原来 caffe 开发者生态社区，因为其开发效率高、特别容易构建各种复杂的深度学习模型网络，因此很快得到大量人工

0 码力 | 13 页 | 5.99 MB | 1 年前
3
TensorFlow on Yarn：深度学习遇上大数据

带来的问题：� • ⼿动指定机器很繁琐� • 端⼝冲突� • 机器负载不均� TensorFlow使用现状及痛点 • ⼿动分发训练样本� • ⼿动拉取训练模型� TensorFlow使用现状及痛点 • 多⼈多服务器使用混乱，计算资源如何划分？� • 没有GPUs集群资源管理和调度（内存、CPU、GPU、端⼝），集群资源负载不均� • 训练数据⼿动分发，训练模型⼿动保存� • 进程遗留问题，需要⼿动杀死� Yarn设计 • 同时支持单机和分布式TensorFlow程序� • 支持GPU资源管理和调度� • 不再需要⼿动配置CluserSpec信息，仅需要设置work 和ps的数量� • 训练数据和训练模型基于HDFS统⼀存储� • 作业训练结束自动回收work、ps和Tensorboard进程� • 训练效果和性能没有损失� 基本目标：� TensorFlow on Yarn设计 • 支持GPU亲和性调度（提⾼通信效率）� --input /home/xitong/tf-test/data \#训练样本HDFS路径� --output /home/xitong/tf-test/outputTest \ #保存模型的HDFS路径� --worker-num 3 \ #work数量 � --worker-memory 8192M \ #每个worker需要的内存� --worker-cores

0 码力 | 32 页 | 4.06 MB | 1 年前
3

共 75 条前往

页

分类

语言

格式