深度学习在电子商务中的应用基于词语聚类的矢量化 基于用户会话的矢量化 原型评测结果及效果示例 • 深度学习与聊天机器人 聊天机器人简介 聊天机器人主要模块及架构 深度学习探索 聊天机器人评测结果 6 • 语义词汇差异 理发器, 理发推子, 电推子 血糖计, 血糖仪 山地车,死飞,自行车,碟刹,折叠车,公路车, 单车 • 解决方案 同义词 ? 归一化 ? 預報 =》预报, 五岁 =》 传统搜索基于文字匹配, 商品包含搜索词或者不包含搜索词 利用深度学习技术, 将搜索词和商品全部数值矢量化, 将文字匹配转化为数值矢量计算 词语矢量化是进一步进行各种深度学习的基础。 • 矢量化模型介绍 Mikolov(Google员工)等人2013发表了两篇关于Word2Vec的文章, 成为词语矢量化表示的基础 Word2vec的优点: 词语矢量考虑了上下文及词语之间的语义关系 来预测上下文词语出现的 概率 10 基于词语聚类的矢量化模型 • Word2vec等工具可以有效地将词语转化为向量 • 将句子/段落/文章有效转化为向量则有很大的挑战。 简单平均/加权平均容易失去句子等的语义/结构信息 直接以句子为单位进行训练, 则训练文本严重不足 • 电商搜索中遇到的主要是句子/短文分析, 可以将短文中的词语聚类, 挑选具有代表 性的词语聚类结果, 来表示整个短文 • 传统0 码力 | 27 页 | 1.98 MB | 1 年前3
动手学深度学习 v2.0Mask R‐CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604 13.9 语义分割和数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605 13.9.1 图像分割和实例分割 图像分割和实例分割 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605 13.9.2 Pascal VOC2012 语义分割数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 606 13.10 转置卷积 . . . . . . . . . . . 度。例如,亚马逊上的产品评级和评论。 在其他一些情况下,客户会提供隐性反馈。例如,某用户跳过播放列表中的某些歌曲,这可能说明这些歌曲 对此用户不大合适。总的来说,推荐系统会为“给定用户和物品”的匹配性打分,这个“分数”可能是估计 的评级或购买的概率。由此,对于任何给定的用户,推荐系统都可以检索得分最高的对象集,然后将其推荐 给用户。以上只是简单的算法,而工业生产的推荐系统要先进得多,它会将详细的用户活动和项目特征考虑0 码力 | 797 页 | 29.45 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112人类的共同愿 景。从目前来看,深度学习是最接近通用智能的算法之一。在计算机视觉领域,过去需要 针对具体的任务设计特征、添加先验假设的做法,已经被深度学习算法彻底抛弃了,目前 在图片识别、目标检测、语义分割、图像变换等方向,几乎都是基于深度学习端到端地训 练,获得的模型性能好,适应性强;在 Atria 游戏平台上,DeepMind 设计的 DQN 算法模 型可以在相同的算法、模型结构和超参数的设定下,在 RCNN、Faster RCNN、Mask RCNN、SSD、YOLO、 RetinaNet 系列等。 语义分割(Semantic Segmentation) 是通过算法自动分割并识别出图片中的内容,可以 将语义分割理解为像素点的分类问题,分析每个像素点的物体的类别信息,如图 1.16 所 示。常见的语义分割模型有 FCN、U-net、PSPNet、DeepLab 系列等。 预览版202112 1 1.4 深度学习应用 11 图 1.15 目标检测效果图 图 1.16 语义分割效果图 视频理解(Video Understanding) 随着深度学习在 2D 图片的相关任务上取得较好的效 果,具有时间维度信息的 3D 视频理解任务受到越来越多的关注。常见的视频理解任务有 视频分类、行为检测、视频主体抽取等。常用的模型有 C3D、TSN、DOVF、TS_LSTM0 码力 | 439 页 | 29.91 MB | 1 年前3
Chatbots 中对话式交互系统的分析与应用Messenger •Microsoft Tay IR-Bot: 智能检索机器人 IR-Bot:检索问答系统 IR-Bot:深度学习 • 句子表示、QA匹配 基于深度学习的智能问答 IR-Bot:深度学习 • 句子表示、QQ匹配 Semantic Question Matching with Deep Learning Task-Bot: 任务对话机器人 Task-Bot: task-oriented subbranch=中关村店) request(phone, name) 理解模块 对话管理 模块 产生模块 Spoken Language Understanding (SLU) • 结构化表示自然语言的语义: • act1 (slot1=value1, slot2=value2,…), act2 (slot1=value1,…), … • acttype, slot, value的取值范围已预先定义好 闲聊机器人 • 问题 • 容易产生“安全”的答案 • 目标函数中考虑 • 对话容易继续进行 • 降低产生“我不知道”这类答案的可能性 • 带来新的信息 • 让产生的答复与之前的不同 • 语义要连贯 • 加入互信息:同时考虑从answer到question的概率 Deep Reinforcement Learning for Dialogue Generation 闲聊机器人:其他因素0 码力 | 39 页 | 2.24 MB | 1 年前3
亚马逊AWSAI Services Overview24 种语言 低延迟、实时 全托管 Polly: 生活化的语音服务 Voice Quality & Pronunciation 1. 自动化、精准的文本处理 2. 智能化的且易于理解 3. 将语义加入文本当中 4. 定制化的发音 文章、博客 训练材料 Chatbots (Lex) 公告 第一代: 面向机器的交互 第二代: 面向控制& 翻译 第三代: 意图导向 人-机交互会话的发展 获得人口学以及情感的数 据推荐最佳照片 • 提高在线约会匹配的推荐 • 动态的个性化广告 人脸比对 测量两张图片中同一个人的可能性 • 为应用和设备添加人脸 验证 • 扩展了物理安全控制的 应用领域 • 客人对VIP 设施的使用 • 在线考试以及民意调查 时的用户验证 人脸识别 通过针对存储的面部向量的集合找到输入面部图像的最接近 的匹配来识别图像中的人 • 社交应用、消息类应用 中加入朋友标签0 码力 | 56 页 | 4.97 MB | 1 年前3
机器学习课程-温州大学-15深度学习-GAN于工程实现。 图 深度卷积生成对抗网络的结构 2. GAN的理论与实现模型 20 GAN的衍生模型 GAN的理论与实现模型 (3)InfoGAN--信息最大化生成对抗网 络,通过隐变量控制语义变化。 图 InfoGAN的结构 2. GAN的理论与实现模型 21 GAN的衍生模型 GAN的理论与实现模型 (4)WGAN --定义了明确的损失函数,对 G&D 的距离给出了数学 定义,较好地解决了训练坍塌问题。 生成输入 随机噪声 23 GAN的衍生模型 GAN的理论与实现模型 (6) Improved GAN--改进生成式对抗网络,提出了使模型训练稳定的五条 经验。 a.特征匹配(feature matching) b.最小批量判断(minibatch discrimination) c.历史平均(historical averaging) GAN的应用 27 GAN的应用 语音和语言领域 a. 用 GAN 来表征对话之间的隐式关联性,从而生成对话文本。 b. 用 CNN 作为判别器, 判别器基于拟合 LSTM 的输出,用矩匹配来解决优化 问题;在训练时,和传统更新多次判别器参数再更新一次生成器不同, 需要多 次更新生成器再更新 CNN 判别器。 SeqGAN 基于策略梯度来训练生成器。 c. 用GAN 基于文本描述0 码力 | 35 页 | 1.55 MB | 1 年前3
机器学习课程-温州大学-特征工程特征对参数调整鲁棒性好,可以根据场景需要调整适宜 的特征点数量进行特征描述,以便进行特征分析。 缺点:不借助硬件加速或者专门的图像处理器很难实现。 疑似特征点检测 去除伪特征点 特征点梯度 与方向匹配 特征描述向量的 生成 步骤 图像特征提取 3. 特征提取 21 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J].统计研究,2019,36(01) 2. HOG特征 方向梯度直方图(HOG)特征是 计算权重,公式为 ?? − ???(?, ?) = ??(?, ?) × ???(?) ??(?, ?) 表示单词 ? 在文档 ? 中出现的频率 ???(?) 是逆文档频率,用来衡量单词 ? 对表达语义所起的重要性,其表示为: ???(?) = log 文章总数 包含单词?的文章总数 + 1 文本特征提取 3. 特征提取 23 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J]0 码力 | 38 页 | 1.28 MB | 1 年前3
机器学习课程-温州大学-09深度学习-目标检测检测则关注特定的物体目标 ,要求同时获得这一目标的 类别信息和位置信息。 分割(Segmentation) 分割包括语义分割(semantic segmentation)和实例分割( instance segmentation),前者 是对前背景分离的拓展,要求 分离开具有不同语义的图像部 分,而后者是检测任务的拓展 ,要求描述出目标的轮廓(相 比检测框更为精细)。 5 目标检测和识别 •0 码力 | 43 页 | 4.12 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波• MPI&RingAllreduce:Horovod,使用 MPI替换grpc,同步通信模式;带宽优化,增加延时; • PS&MPI:DistributionStrategy API,统一分布式语义,解耦分布式架构与模型训练框架 • 使用FP16通信,使用FP32做计算,带宽压力降低一倍 • IO优化 • 多线程样本并发读取,样本读取与计算PIPELINE,实现计算与IO的overlap 4 深度学习-分布式模型推理 • 深度特征效果对比 • 文本Embedding特征,相比于文本标签,相关指标提升约3+% • 基于word2vec、bert等生成embedding向量,提高了语义编码的准确性,降低了训练成本 • 指标提升主要来源于Embedding特征保留了更多原始信息,避免了标签带来的信息损失 • User/Item Embedding 协同召回 • Item2ve0 码力 | 36 页 | 16.69 MB | 1 年前3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文用 系 统 的 服 务 个人简介——达观数据CEO 陈运文 达观数据:全球领先的文本智能处理专家 l 为企业提供文本挖掘、知识图谱、搜索引擎和个性化推荐等文本智能处理技术服 务,是国内首家将自动语义分析技术应用于企业数据化运营的人工智能公司 专注于文本挖掘的国际领军人工智能企业 l 获得全球三十大最佳AI企业等荣誉,拥有国家级高新技术企业、CMMI3资质认 证、ISO9001质量管理体系认证、双软认证等最全面的企业服务资质。 0, … ] [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, … ] one-hot表示 高维,稀疏,正交,无法计算语义相关性 字词表示 威海市 [ -2.0795249939, 1.4055569172, 1.9540510178, … -0.651816964, -6.1333961487, -0.51071900130 码力 | 46 页 | 25.61 MB | 1 年前3
共 20 条
- 1
- 2













