消息引擎 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

阿里云上深度学习建模实践-程孟力

PAI-Rec – 推荐引擎 BE召回/Hologres hot x2i vec 排序粗排精排重排 MaxCompute Datahub 离线特征样本构造实时特征 Flink 训练数据推荐日志模型发布在线流程离线流程智能推荐解决方案 > PAI-REC 推荐引擎 PAI-REC 推荐引擎多路召回曝光/状态过滤粗排/精排拉取配置监控报警 Prometheus Grafana 读取metric 消息队列(datahub/kafka) PAI-REC平台自动化降级负载均衡灰度发布超时控制平台支持日志SLS 在线存储 Hologres/OTS BE Redis 读取数据向量引擎 BE/Hologres/Faiss/Milvus 向量检索冷启动召回冷启动排 Frameworks ML Service (PaaS) AI Service (SaaS) 机器学习框架(PAI-TensorFlow/PAI-PyTorch/Caffe /Alink/…) 计算引擎(MaxCompute / EMR / Flink) 基础硬件（CPU/GPU/FPGA/NPU）阿里云容器服务(ACK) • 200+组件 • 数十个场景化模版 • 所见即所得交互式建模（DSW）

0 码力 | 40 页 | 8.51 MB | 1 年前
3
亚马逊AWSAI Services Overview

for Autonomous Driving Clarifai • Computer Vision APIs AWS 上的 AI 应用 • Pinterest Lens • Netflix 推荐引擎数千名员工致力于人工智能领域发现& 搜索执行 &物流现有产品的增强定义新的产品分类将机器学习拓展更广领域 Amazon 的人工智能应用在Amazon 最初的人工智能应用 (1995) 可以帮助客户把人工智能应用于每个应用程序的核心&业务之中吗? Amazon AI 构建于深度学习之上的智能服务 Amazon AI: 新的深度学习服务生活化的语音服务 Polly Lex 对话引擎 Rekognition 图像分析深度学习框架 MXNet, TensorFlow, Theano, Caffe, Torch 为客户模型定制的深度学习框架人工智能的托管的 API服务扩展了物理安全控制的应用领域 • 客人对VIP 设施的使用 • 在线考试以及民意调查时的用户验证人脸识别通过针对存储的面部向量的集合找到输入面部图像的最接近的匹配来识别图像中的人 • 社交应用、消息类应用中加入朋友标签 • 协助找到始终人口 • 确定可以访问敏感区域的员工 • 在历史和媒体的档案中找到“名人” 应用案例：公共安全领域的智能应用人工智能的时代已经到来 Amazon

0 码力 | 56 页 | 4.97 MB | 1 年前
3
Keras: 基于 Python 的深度学习库

2.3 Keras 可以轻松将模型转化为产品 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.4 Keras 支持多个后端引擎，并且不会将你锁定到一个生态系统中 . . . . . . . . . . 6 2.5 Keras 拥有强大的多 GPU 和分布式训练支持 . . . . . . . . . . . . . . 目录中，你会找到更多高级模型：基于记忆网络的问答系统、基于栈式 LSTM 的文本生成等等。 KERAS: 基于 PYTHON 的深度学习库 3 1.4 安装指引在安装 Keras 之前，请安装以下后端引擎之一：TensorFlow，Theano，或者 CNTK。我们推荐 TensorFlow 后端。 • TensorFlow 安装指引。 • Theano 安装指引。 • CNTK 安装指引。网页应用后端（比如 Flask app）中。 • 在 JVM，通过 SkyMind 提供的 DL4J 模型导入。 • 在 Raspberry Pi 树莓派上。 2.4 Keras 支持多个后端引擎，并且不会将你锁定到一个生态系统中你的 Keras 模型可以基于不同的深度学习后端开发。重要的是，任何仅利用内置层构建的 Keras 模型，都可以在所有这些后端中移植：用一种后端训练模型，再将它载入另一种后端中（比

0 码力 | 257 页 | 1.19 MB | 1 年前
3
动手学深度学习 v2.0

流程，所以我们不得不自行组装。我们在 16.5节中详细描述了我们的方法。我们选择GitHub来共享源代码并允许编辑，选择Jupyter记事本来混合代码、公式和文本，选择Sphinx作为渲染引擎来生成多个输出，并为论坛提供讨论。虽然我们的体系尚不完善，但这些选择在相互冲突的问题之间提供了一个很好的妥协。我们相信，这可能是第一本使用这种集成工作流程出版的书。 1 http://distill 零编写的。比如，现在开发人员要编写一个程序来管理网上商城。经过思考，开发人员可能提出如下一个解决方案：首先，用户通过Web浏览器（或移动应用程序）与应用程序进行交互；紧接着，应用程序与数据库引擎进行交互，以保存交易历史记录并跟踪每个用户的动态；其中，这个应用程序的核心——“业务逻辑”，详细说明了应用程序在各种情况下进行的操作。为了完善业务逻辑，开发人员必须细致地考虑应用程序所有可能遇到的边界情况，并为这些边界情况设计合每个元素分配相应的相关性分数，然后检索评级最高的元素。 PageRank15，谷歌搜索引擎背后最初的秘密武器就是这种评分系统的早期例子，但它的奇特之处在于它不依赖于实际的查询。在这里，他们依靠一个简单的相关性过滤来识别一组相关条目，然后根据PageRank对包含查询条件的结果进行排序。如今，搜索引擎使用机器学习和用户行为模型来获取网页相关性得分，很多学术会议也致力于这一主题。推荐系统

0 码力 | 797 页 | 29.45 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

提供系统的平台化工具，为用户提供易用的界面操作； MLX模型能力 MLX平台架构 MLX平台架构 • 基于Worker + PS架构搭建 • Worker  模型计算引擎（Engine）  计算图框架（Graph） • 模型计算引擎Engine  模型结构处理  与PS通信交换模型参数  计算图的计算 • 计算图框架Graph  计算逻辑抽象op，通过op组合形成模型结构   定义了流式数据的时钟，不可逆性  Smooth low watermark：异常数据时间跳变流式拼接 • Checkpoint解决不重不丢问题  外存解决大数据量性能问题  在引擎中流转log key，特征数据在外存 • 分业务场景支持  轻量级predictor：仅支持模型的计算，特征由业务传入，无状态设计  自定义predictor：提供业务抽象，支持业务自定义逻辑，插件化实现逻辑阶段抽象，业务根据自身需求选择性实现  数据获取：根据业务的自身逻辑获取特征原始数据  特征抽取：将特征数据进行转换，转换成模型所需的格式，比如离散化  模型计算：传入转换后的特征数据，调用模型计算引擎在线预估服务 • 特征编码方式  通过明文hash的方式编码  适用于特征的动态增长  不需要预分配，提高处理效率 • 框架与实现分离  提供op形式的特征抽取类  逻辑一致性：在线、近线、离线

0 码力 | 41 页 | 5.96 MB | 1 年前
3
深度学习在电子商务中的应用

目前商品搜索中的一些问题 7 人工智能／深度学习在搜索中的应用：网页／电商搜索 • 基于深度学习的（Query, Document）分数是Google搜索引擎中第3重要的排序信号 • 亚马逊（Amazon／A9)电子商务搜索引擎中，深度学习还在实验阶段，尚未进入生产线。 8 • 搜索数值矢量化  传统搜索基于文字匹配，商品包含搜索词或者不包含搜索词  利用深度学习技术，将搜索词和商品全部数值矢量化，用户点击日志用户购物车日志用户购买日志 Word2vec模型计算距离最近的矢量产品类别过滤产品频率过滤矢量转换回商品 14 原型评测结果矢量化搜索引擎与易购传统引擎搜索效果对比（2016-07-25测试结果） 15 • 该技术不仅召回与搜索词完全匹配的结果，还可召回与搜索词文本不匹配、但含义近似的结果。效果示例如：经测评，当搜索词为“松下筒灯”，

0 码力 | 27 页 | 1.98 MB | 1 年前
3
微博在线机器学习和深度学习实践-黄波

• 加快计算速度： batching/TensorRT/MPS/SSE/AVX/Neon • operator fusion • 针对特定场景重写耗时算子 • 重构tensorflow计算引擎 • batching • 批量调度请求到GPU，增大并发和吞吐量 4 深度学习-分布式模型推理 • 深度特征效果对比 • 文本Embedding特征，相比于文本标签，相关指标提升约3+% 算法/模型（WeiFlow）模型训练/评估样本库模型库模型服务/推荐引擎数据/特征（WeiData）数据/特征生成数据/特征存储数据/特征服务 2 平台架构用户微博曝光/阅读点击/互动 Feed流排序数据样本正样本：曝光有互动负样本：曝光无互动样本数据推荐引擎业务引擎用户特征女性，19-22岁，北京爱好娱乐，明星，高活跃……

0 码力 | 36 页 | 16.69 MB | 1 年前
3
机器学习课程-温州大学-10机器学习-聚类

K-means、密度聚类、层次聚类聚类主要应用市场细分、文档聚类、图像分割、图像压缩、聚类分析、特征学习或者词典学习、确定犯罪易发地区、保险欺诈检测、公共交通数据分析、IT资产集群、客户细分、识别癌症数据、搜索引擎应用、医疗应用、药物活性预测…… 7 1.无监督学习方法概述聚类案例 1.医疗医生可以使用聚类算法来发现疾病。以甲状腺疾病为例。当我们对包含甲状腺疾病和非甲状腺疾病的数据集应用无监督学习时，可银行可以观察到可能的金融欺诈行为，就此向客户发出警告。在聚类算法的帮助下，保险公司可以发现某些客户的欺诈行为，并调查类似客户的保单是否有欺诈行为。 10 1.无监督学习方法概述聚类案例 4.搜索引擎百度是人们使用的搜索引擎之一。举个例子，当我们搜索一些信息，如在某地的超市，百度将为我们提供不同的超市的选择。这是聚类的结果，提供给你的结果就是聚类的相似结果。 11 1.无监督学习方法概述

0 码力 | 48 页 | 2.59 MB | 1 年前
3
AI大模型千问 qwen 中文文档

请注意，原 Qwen 仓库中的旧方法 chat() 现在已被 generate() 方法替代。这里使用了 apply_chat_template() 函数将消息转换为模型能够理解的格式。其中的 add_generation_prompt 参数用于在输入中添加生成提示，该提示指向 <|im_start|>assistant\n 。尤其需要注意的是，我们遵循先前实践，对 apply_chat_template(msg, tokenize=False, add_generation_ �→prompt=False) data.append(text.strip()) 其中每个 msg 是一个典型的聊天消息，如下所示： [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": 选字段。messages 字段是一个 JSON 对象列表，每个对象都包含两个字段：role 和 content 。其中，role 可以是 system 、user 或 assistant ，表示消息的角色；content 则是消息的文本内容。而 source 字段代表了数据来源，可能包括 self-made 、alpaca 、open-hermes 或其他任意字符串。你需要用 json 将一个字典列表存入

0 码力 | 56 页 | 835.78 KB | 1 年前
3
谭国富：深度学习在图像审核的应用

微云相册识别，广点通广告识别，顺丰快递单据识别，微云文本识别等 SACC2017 更多图像定制识别功能 l 图标识别 Ø 图标形式：水印、二维码、条形码、logo等。并可根据业务需求定制。 Ø 基于团队自研的深度识别引擎，核心算法与基础模型经过多轮优化，可以准确快速地识别图片中所包含的各类图标 l 烟雾，吸烟识别 Ø 基于视频直播监管需求，提供吸烟，烟雾，涉嫌吸毒等场景的识别能力 SACC2017 内容审核解决方案 SACC2017 针对直播 – 视频鉴黄解决方案 • 在部署了DeepEye视频直播鉴黄解决方案后，系统对直播房间的视频流按指定的时间间隔（用户可配置）进行截图，通过鉴黄引擎给该图片进行鉴别，并将可疑图片和对应的房间信息回调给开发者，开发者可以根据返回的结果信息优先给审核人员进行审核，进行封停等进一步处理。经过审核没有问题的内容再呈现倒观看者的屏幕。 SACC2017

0 码力 | 32 页 | 5.17 MB | 1 年前
3

共 17 条前往

页

分类

语言

格式