文档格式 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

AI大模型千问 qwen 中文文档

Qwen Qwen Team 2024 年 05 月 11 日快速开始 1 文档 3 i ii Qwen Qwen is the large language model and large multimodal model series of the Qwen Team, Alibaba Group. Now the large language models have been ModelScope • Qwen1.5 Collection 加入社区，加入 Discord 和微信群。很期待见到你们！快速开始 1 Qwen 2 快速开始 CHAPTER1 文档 1.1 安装要快速上手 Qwen1.5，您可以从 Hugging Face 安装 transformers 库，并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 generate() 配合 tokenizer 中的 apply_chat_template() 方法。如果你想使用 Flash Attention 2，你可以用下面这种方式读取模型： 4 Chapter 1. 文档 Qwen model = AutoModelForCausalLM.from_pretrained( "Qwen/Qwen1.5-7B-Chat", torch_dtype="auto", device_map="auto"

0 码力 | 56 页 | 835.78 KB | 1 年前
3
Keras: 基于 Python 的深度学习库

便本地查阅，下载最新 PDF 版本请访问: https://github.com/wanzhenchn/keras-docs-zh。感谢 keras-team 所做的中文翻译工作，本文档制作基于此处。严正声明：本文档可免费用于学习和科学研究，可自由传播，但切勿擅自用于商业用途，由此引发一切后果贡献者概不负责。 The main reason of organizing PDF version Keras： • 允许简单而快速的原型设计（由于用户友好，高度模块化，可扩展性）。 • 同时支持卷积神经网络和循环神经网络，以及两者的组合。 • 在 CPU 和 GPU 上无缝运行。查看文档，请访问 Keras.io。 Keras 兼容的 Python 版本: Python 2.7-3.6。 1.2 指导原则 • 用户友好。Keras 是为人类而不是为机器设计的 API。它把用户体验放在首要和中心位置。易扩展性。新的模块是很容易添加的（作为新的类和函数），现有的模块已经提供了充足的示例。由于能够轻松地创建可以提高表现力的新模块，Keras 更加适合高级研究。 • 基于 Python 实现。Keras 没有特定格式的单独配置文件。模型定义在 Python 代码中，这些代码紧凑，易于调试，并且易于扩展。 1.3 快速开始：30 秒上手 Keras Keras 的核心数据结构是 model，一种组织网络层的方式。最简单的模型是

0 码力 | 257 页 | 1.19 MB | 1 年前
3
动手学深度学习 v2.0

处理缺失值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.2.3 转换为张量格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.3 线性代数 . . . . . . 6.3 期望和方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 2.7 查阅文档 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 2.7.1 提交主要更改 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 764 16.6 d2l API 文档 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 767 16.6.1 模型

0 码力 | 797 页 | 29.45 MB | 1 年前
3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文

MI3资质认证、ISO9001质量管理体系认证、双软认证等最全面的企业服务资质。权威认证的人工智能服务，可充分保障客户业务实践与业务安全 l 覆盖金融、制造、法律、电商、传媒等行业，提升企业文档自动化处理能力为数百家中国知名客户提供完善的文本智能处理服务 01 文本智能处理背景简介 7 文本语音图像人工智能 Voice Image Text 达观专注于人工智能中的文本处理细分领域风险智能审核功能达观智能文档审阅平台错误智能纠正功能文档智能比对功能常见应用场景智能文档审阅系统：抽取核心算法智能文档审阅系统：段落分析 PDF格式文本数据丢失段落信息使用深度学习进行段落分析生成式摘要生成式摘要的深度学习网络基本结构 l 编码器/解码器结构，都是神经网络结构 l 输入的原文经过编码器编码变成向量

0 码力 | 46 页 | 25.61 MB | 1 年前
3
机器学习课程-温州大学-numpy使用总结

al array object）是储存单一数据类型的多维数组。 ufunc：全称（universal function object）它是一种能够对数组进行处理的函数。 NumPy的官方文档： https://docs.scipy.org/doc/numpy/reference/ NumPy是什么？ 7 Anaconda里面已经安装过NumPy。原生的Python安装： · 2) for t in x])#列表生成式 array([0, 2, 2, 0, 2, 0, 0, 2, 2, 0, 0]) 28 自定义ufunc函数使用frompyfunc()进行转化，调用格式如下： > numb_judge = np.frompyfunc(num_judge, 2, 1) > y = numb_judge(x,2) array([0, 2, 2, 0, 2, 0, 0

0 码力 | 49 页 | 1.52 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

开发效率较低，模型编译时间较长，同时开发人员转投 TensorFlow 等原因，Theano 目前已经停止维护。 ❑ Scikit-learn 是一个完整的面向机器学习算法的计算库，内建了常见的传统机器学习算法支持，文档和案例也较为丰富，但是 Scikit-learn 并不是专门面向神经网络而设计的，不支持 GPU 加速，对神经网络相关层的实现也较欠缺。 ❑ Caffe 由华人贾扬清在 2013 年开发，主语言使用人群较少，Torch 一直未能获得主流应用。 ❑ MXNet 由华人陈天奇和李沐等人开发，是亚马逊公司的官方深度学习框架。采用了命令式编程和符号式编程混合方式，灵活性高，运行速度快，文档和案例也较为丰富。 ❑ Keras 是一个基于 Theano 和 TensorFlow 等框架提供的底层运算而实现的高层框架，提供了大量快速训练、测试网络的高层接口。对于常见应用来说，使用 https://www.python.org/网站下载最新版本(Python 3.7)的解释器，像普通的应用软件一样安装完成后，就可以调用 python.exe 程序执行 Python 语言编写的源代码文件(.py 格式)。这里选择安装集成了 Python 解释器和虚拟环境等一系列辅助功能的 Anaconda 软件，用户通过安装 Anaconda 软件，可以同时获得 Python 解释器、包管理和虚拟环境等一系列

0 码力 | 439 页 | 29.91 MB | 1 年前
3
深度学习在电子商务中的应用

词语矢量考虑了上下文及词语之间的语义关系  复杂词语可以通过矢量计算来实现（如 Vec（北京）＝ vec(东京) – vec(日本) + vec(中国) ）  矢量化模型的现况  词语的矢量化模型已经有开源实现方案  句子和文档的矢量化还在摸索阶段，尚不成熟  已经有一些在词语相似度，舆情分析等方面的应用矢量化搜索模型 9 词语矢量化模型 CBOW: 通过上下文词语来预测词语本身出现的概率 Skip-gram: 词语i 与cluster j的余弦相似度 Random: 生成一个0 – 1之间的随机数基于词语聚类的矢量化模型 12 • 把搜索词和商品文档各自作为整体看待，直接学习训练各自的矢量值 • 通过分析用户每次访问的行为顺序，构建有“搜索词”和“商品文档”组成的句子 • 训练集是采用苏宁易购的用户搜索日志作为来源。在经过数据清理之后，按照搜索的时间顺序，结合商品的点击，商品放入购物车，商品的购买这些用户行为，而建立的应用示例：苏宁易购机器人Sunny，百度度秘，Amazon Echo 19 问题分析与用户分析网页前端移动应用前端系统架构图会话分析用户意图识别检索模块段落或句子检索文档检索专业检索接口：商品参数接口商品价格接口商品信息接口商品卖点接口促销活动接口订单信息接口语法语义分析用户画像 Json/rest 答案获取和排序模块答案实体抽取

0 码力 | 27 页 | 1.98 MB | 1 年前
3
《TensorFlow 快速入门与实战》6-实战TensorFlow验证码识别

Clark 及社区贡献者一起开发和维护的一款分叉自 PIL 的图像工具库。至今，社区依然非常活跃，Pillow 仍在快速迭代。 Pillow提供广泛的文件格式支持，高效的内部表示和相当强大的图像处理功能。核心图像库旨在快速访问以几种基本像素格式存储的数据，它应该为一般的图像处理工具提供坚实的基础。 https://github.com/python-pillow/Pillow captcha language）。其主要依赖 pyparsing 和 GraphViz 这两个工具库。 pyparsing：仅用于加载DOT文件，在 pydot 安装期间自动安装。 GraphViz：将图形渲染为PDF，PNG，SVG等格式文件，需独立安装。 https://github.com/lepture/captcha flask flask 是一个基于 Werkzeug 和 jinja2 开发的 Python Web 应用程序框架，遵从生成验证码图像 “Hello TensorFlow” Try it 输入与输出数据处理输入数据处理图像处理：RGB图 -> 灰度图 -> 规范化数据输入数据处理适配 Keras 图像数据格式：“channels_frist” 或 “channels_last” 输出数据处理 One-hot 编码：验证码转向量输出数据处理解码：模型输出向量转验证码 argmax “Hello

0 码力 | 51 页 | 2.73 MB | 1 年前
3
机器学习课程-温州大学-01机器学习-引言

元组类似列表，元组里面的元素也是进行索引计算。列表里面的元素的值可以修改，而元组里面的元素的值不能修改，只能读取。元组的符号是( ) ⚫集合(set) 集合主要有两个功能，一个功能是进行集合操作，另一个功能是消除重复元素。集合的格式是：set( )，其中()内可以是列表、字典或字符串，因为字符串是以列表的形式存储的 ⚫字典(dict) 字典dict也叫做关联数组，用大括号{ }括起来，在其他语言中也称为map，使用键-值（ pd.read_json() | 从JSON格式的URL或文件读取 pd.read_clipboard() | 从剪切板读取将DataFrame写入⽂件 df.to_csv() | 写入CSV文件 df.to_excel() | 写入Excel文件 df.to_sql() | 写入SQL表或数据库 df.to_json() | 写入JSON格式的文件 df.to_clipboard()

0 码力 | 78 页 | 3.69 MB | 1 年前
3
机器学习课程-温州大学-01深度学习-引言

元组类似列表，元组里面的元素也是进行索引计算。列表里面的元素的值可以修改，而元组里面的元素的值不能修改，只能读取。元组的符号是( ) ⚫集合(set) 集合主要有两个功能，一个功能是进行集合操作，另一个功能是消除重复元素。集合的格式是：set( )，其中()内可以是列表、字典或字符串，因为字符串是以列表的形式存储的 ⚫字典(dict) 字典dict也叫做关联数组，用大括号{ }括起来，在其他语言中也称为map，使用键-值（ pd.read_json() | 从JSON格式的URL或文件读取 pd.read_clipboard() | 从剪切板读取将DataFrame写入⽂件 df.to_csv() | 写入CSV文件 df.to_excel() | 写入Excel文件 df.to_sql() | 写入SQL表或数据库 df.to_json() | 写入JSON格式的文件 df.to_clipboard()

0 码力 | 80 页 | 5.38 MB | 1 年前
3

共 25 条前往

页

分类

语言

格式