机器学习课程-温州大学-13深度学习-Transformer如何设计网络呢?需要分别计算答案的起始和终止位置 4.BERT 待分类句子A: Datawhale 是 一个 专注于 Al领域 的开源组织 模型输出以下各token的向量: [CLS]Datawhale 是 一个 专注于 Al领域 的开源 组织[SEP] [CLS]表示的向量一般可以认为是句向量,用[CLS] 向量对接下游文本分类任务,可得到fine tuning的 文本分类模型0 码力 | 60 页 | 3.51 MB | 1 年前3
《TensorFlow 快速入门与实战》6-实战TensorFlow验证码识别, 它应该为一般的图像处理工 具提供坚实的基础。 https://github.com/python-pillow/Pillow captcha Catpcha 是一个生成图像和音频验证码的开源工具库。 https://github.com/lepture/captcha from captcha.image import ImageCaptcha from captcha.audio https://github.com/lepture/captcha flask flask 是一个基于 Werkzeug 和 jinja2 开发的 Python Web 应用程序框架,遵从 BSD 开源协 议。它以一种简约的方式实现了框架核心,又保留了扩展性。 https://github.com/pallets/flask 生成验证码数据集 验证码(CAPTCHA)简介 全自动区分计算 这包括Yahoo验证码的一个早期版本 EZ-Gimpy,PayPal使用的验证码,LiveJournal、 phpBB使用的验证码,很多金融机构(主要是银行)使用的网银验证码以及很多其他网站 使用的验证码。 俄罗斯的一个黑客组织使用一个自动识别软件在2006年破解了Yahoo的CAPTCHA。准确 率大概是15%,但是攻击者可以每天尝试10万次,相对来说成本很低。而在2008年, Google的CAPTCHA也被俄罗斯0 码力 | 51 页 | 2.73 MB | 1 年前3
深度学习在电子商务中的应用词语矢量考虑了上下文及词语之间的语义关系 复杂词语可以通过矢量计算来实现(如 Vec(北京)= vec(东京) – vec(日本) + vec(中国) ) 矢量化模型的现况 词语的矢量化模型已经有开源实现方案 句子和文档的矢量化还在摸索阶段,尚不成熟 已经有一些在词语相似度,舆情分析等方面的应用 矢量化搜索模型 9 词语矢量化模型 CBOW: 通过上下文词语 来预测词语本身出现的概 电商领域内的各种专业字典(如品牌,产品,型号等)可以协助识别各种实体 自然语言处理 (Natural Language Processing) 21 命名实体识别 命名识别模块 人名 地名 品牌名 商品名 机构组织名 …… 识别用户输入中的各种 实体是进一步识别用户 意图的基础 22 用户意图识别 用户意图识别模块 商品研究 下单购买 订单查询 售后服务 其它闲聊 …… • 用户意图识别是非常0 码力 | 27 页 | 1.98 MB | 1 年前3
机器学习课程-温州大学-numpy使用总结Python)是Python的一种开源的数值计算扩展库。 它包含很多功能: · 创建n维数组(矩阵) · 对数组进行函数运算 · 数值积分 · 线性代数运算 · 傅里叶变换 · 随机数产生 ······ NumPy是什么? 5 NumPy提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处 理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大 型金融公司使用,以及核心的科学计算组织如:Lawrence0 码力 | 49 页 | 1.52 MB | 1 年前3
动手学深度学习 v2.0Kaggle 比赛:图像分类 (CIFAR‐10) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632 13.13.1 获取并组织数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633 13.13.2 图像增广 . . . 思考更深奥的 概率分布之前,先体会一下训练模型的满足感。 除了提供基本数学背景速成课程的几节初步课程外,后续的每一章都介绍了适量的新概念,并提供可独立工 作的例子——使用真实的数据集。这带来了组织上的挑战。某些模型可能在逻辑上组合在单节中。而一些想 法可能最好是通过连续允许几个模型来传授。另一方面,坚持“一个工作例子一节”的策略有一个很大的好 处:这使你可以通过利用我们的代码尽可能轻松地 matplotlib_inline import backend_inline d2l = sys.modules[__name__] 本书中的大部分代码都是基于PyTorch的。PyTorch是一个开源的深度学习框架,在研究界非常受欢迎。本书 中的所有代码都在最新版本的PyTorch下通过了测试。但是,由于深度学习的快速发展,一些在印刷版中代 码可能在PyTorch的未来版本无法正常工作。但是0 码力 | 797 页 | 29.45 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇开发者的欢迎。其模型训练支持CPU与GPU、支持分布式训练、 云部署、针对深度学习特定领域有不同的丰富的扩展库。 1.1.1 Pytorch 历史 Pytorch 在 2016 年由 facebook 发布的开源机器学习(深度 学习)框架,Pytorch 最初的来源历史可以追溯到另外两个 机器学习框架,第一个是 torch 框架,第二个是 Chainer,实 现了 Eager 模式与自动微分,Pytoch 开发实战系列教程 第一篇 5 上图 1-3 中标量、向量、数组、3D、4D、5D 数据矩阵在深 度学习框架中都被称为张量。可见在深度学习框架中所有的数 据都是张量形式存在,张量是深度学习数据组织与存在一种数 据类型。 ● 算子 / 操作数 深度学习主要是针对张量的数据操作、这些数据操作从简单到 复杂、多数都是以矩阵计算的形式存在,最常见的矩阵操作就 是加减乘除、此外卷积、池化、激活、也是模型构建中非常有0 码力 | 13 页 | 5.99 MB | 1 年前3
Keras: 基于 Python 的深度学习库没有特定格式的单独配置文件。模型定义在 Python 代码中,这 些代码紧凑,易于调试,并且易于扩展。 1.3 快速开始:30 秒上手 Keras Keras 的核心数据结构是 model,一种组织网络层的方式。最简单的模型是 Sequential 顺 序模型,它是由多个网络层线性堆叠的栈。对于更复杂的结构,你应该使用 Keras 函数式 API, 它允许构建任意的神经网络图。 Sequential 等众多网站上使用。它尤其受以深度学习作为产品核心的创业公司的欢迎。 Keras 也是深度学习研究人员的最爱,在上载到预印本服务器 arXiv.org 的科学论文中被提 及的次数位居第二。Keras 还被大型科学组织的研究人员采用,特别是 CERN 和 NASA。 2.3 Keras 可以轻松将模型转化为产品 与任何其他深度学习框架相比,你的 Keras 模型可以轻松部署在更广泛的平台上: • 在 iOS TensorFlow 后端,Theano 后端,CNTK 后端。 • TensorFlow 是由 Google 开发的一个开源符号级张量操作框架。 • Theano 是由蒙特利尔大学的 LISA Lab 开发的一个开源符号级张量操作框架。 • CNTK 是由微软开发的一个深度学习开源工具包。 将来,我们可能会添加更多后端选项。 14.2 从一个后端切换到另一个后端 如果您至少运行过一次 Keras,您将在以下位置找到0 码力 | 257 页 | 1.19 MB | 1 年前3
AI大模型千问 qwen 中文文档make 然后你就能使用 llama.cpp 运行 GGUF 文件。 8 Chapter 1. 文档 Qwen 1.4.2 运行 Qwen 的 GGUF 文件 我们在 Hugging Face 组织中提供了一系列 GGUF 模型,为了找到您需要的模型,您可以搜索仓库名称中包含 -GGUF 的部分。要下载所需的 GGUF 模型,请使用 huggingface-cli(首先需要通过命令 pip install LLaMA-Factory 在 data 文件夹中提供了多个训练数据集,您可以直接使用它们。如果您打算使用自定义数 据集,请按照以下方式准备您的数据集。 1. 请将您的数据以 json 格式进行组织,并将数据放入 data 文件夹中。LLaMA-Factory 支持以 alpaca 或 sharegpt 格式的数据集。 • alpaca 格式的数据集应遵循以下格式: [ { "instruction":0 码力 | 56 页 | 835.78 KB | 1 年前3
阿里云上深度学习建模实践-程孟力MapReduce Blink 场景丰富: 图像/视频/推荐/搜索 大数据+大模型: Model Zoo 跨场景+跨模态 开箱即用: 封装复杂性 白盒化, 可扩展性强 积极对接开源系统+模型 FTRL SGD Adam Solutions Librarys 优势: Components Framework EasyVision EasyRec GraphLearn • PAIFlow • OpenAPI AI能力 体验中心 开源 PAI平台(Platform of Artificial Intelligence) Deep Learning Container 数据量大而全 先进的模型结构 业务场景复杂 计算力强、性价比高 提供 支撑 支撑 支撑 促进 促进 开源生态 系统 硬件 模型 生态系统 外循环 内循环 贡献0 码力 | 40 页 | 8.51 MB | 1 年前3
TensorFlow on Yarn:深度学习遇上大数据Yarn技术细节揭秘 实现Yarn Application的标准流程:� TensorFlow on Yarn技术细节揭秘 集成TensorFlow到Yarn面临的特定问题:� • 如何自组织ClusterSpec信息� • 训练数据的划分� • 如何启动Tensorboard服务� • 如何降低迁移成本� • 已分配的物理GPU设备号到用户态GPU设备号的映射� TensorFlow0 码力 | 32 页 | 4.06 MB | 1 年前3
共 22 条
- 1
- 2
- 3













