《TensorFlow 2项目进阶实战》3-方案设计篇:如何设计可落地的AI解决方案方案设计篇:如何设计可落地的AI解决方案 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 行业背景:AI新零售是什么? • 用户需求:线下门店业绩如何提升? • 长期⽬目标:货架数字化与业务智能化 • 短期目标:自动化陈列审核和促销管理 • 方案设计:基于深度学习的检测/分类的AI流水线 • 方案交付:支持在线识别和API调用的 AI SaaS 目录 行业背景:AI新零售是什么 纯度 排面 SKU 种类 数量 位置 品类 占比 货架 设计 场景 层数 编号 销售执行三板斧:分销达标 销售执行三板斧:新品上架陈列稽查 销售执行三板斧:陈列激励 方案设计: 基于深度学习的检测/分类的AI流水线 货架商品检测 货架商品检测 Bottle(瓶装) Combination(组合装) 货架商品检测 Bottle(瓶装) Combination(组合装) 商品识别 AI 流水线 [[Bbox1], [Bbox2], …] [[Bbox1, Score1, Label1], [Bbox2, Score2, Label2], …] Image 方案交付: 支持在线识别和API调用的 AI SaaS AI SaaS Showcase AI SaaS Showcase AI SaaS Showcase AI SaaS Showcase0 码力 | 49 页 | 12.50 MB | 1 年前3
阿里云上深度学习建模实践-程孟力深度学习应用主要的挑战: 2.模型效果优 化困难 3.工程优化复 杂 4.数据获取困 难 挑战 深度模型是非线性的: • 参数很多 • 参数敏感 • 不同场景的数据上差异大 1.方案复杂 从FM到DeepFM rt 增 加了10倍怎么优化? 手里面只有5张图片, 怎么搞出来一个效果还 不错的模型? ✗ 标注速度慢 ✗ 标注成本高 ✗ 样本分布不均匀 ✗ 隐私保护 • 多个环节 ✗ 标注成本高 ✗ 样本分布不均匀 ✗ 隐私保护 • 多个环节 • 多种模型 ✗ 海量参数 ✗ 海量数据 从FM到DeepFM rt 增 加了10倍怎么优化? 2.模型效果优 化困难 1.方案复杂 Data Model Compute Platform 要求: 准确: 低噪声 全面: 同分布 模型选型: 容量大 计算量小 训练推理: 高qps, 低rt 支持超大模型 多样性/冷启动 实人认证: 卡证识别 + 人脸检测 + 活体检测 + 人脸 识别 … 模型构建: 问题: ✗ 方案复杂周期长/见效慢 ✗ 细节多难免踩坑 解决方案: 标准化 标准化模型库 标准化解决方案 1.方案复杂 图像 搜索 推荐 语音 视频理解 NLP 广告 CNN RNN GNN MLP Tensorflow PyTorch Parameter0 码力 | 40 页 | 8.51 MB | 1 年前3
超大规模深度学习在美团的应用-余建平工程相关的工作,加入美团后,负责超大规模机器学习系统,从无到有搭建起支持千亿 级别规模的深度学习系统,与推荐、搜索、广告业务深度合作,在算法上提供从召回到 排序的全系统优化方案,在工程上提供离线、近线、在线的全流程解决方案。 目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX MLX平台目标 MLX平台架构 • 模型场景应用 召回模型 排序模型 目录 AUC、Loss、MAE、RMSE 支持外部eval工具,计算MAP、NDCG MLX的模型能力 • 提供离线、近线、在线全流程解决方案,各阶段提供扩展方案,降低算法迭代成本; • 支持Online Learning,提供从近线到在线的模型数据通路; • 提供从召回到排序全流程的模型解决方案,为业务提供最佳实践; • 提供系统的平台化工具,为用户提供易用的界面操作; MLX模型能力 MLX平台架构 MLX平台架构 99% ^ 64 = 99.36% 128分片整体可用性:99.99% ^ 128 = 98.72% • Backup Request Jeff Dean在解决BigTable高扇出时提出的方案 PS的长尾效应 Backup Request 副本1 副本2 PS Shard 1 副本1 副本2 PS Shard 2 副本1 副本2 PS Shard N Predictor0 码力 | 41 页 | 5.96 MB | 1 年前3
谭国富:深度学习在图像审核的应用业务痛点:面对越来越爆发的安全风险,解决办法门 槛高, 成本高;迫切需要技术解决方案 SACC2017 图像内容审核技术 OCR技术 图像分割以及超分辨率技术 优图图像技术还包括:图像分类、图像增强、艺术滤镜、图片去水印、图像融合、图像修补等。 图像识别技术 01 腾讯优图图像技术能力 SACC2017 内容审核 - 图片鉴黄解决方案 区分图像中的色情、性感和正常内容 DeepEye可给出图片属于色情、性感和正常 性质属于属于暴恐还是正常。 Ø 高准确率: 在内部业务上测试,准确率97%,覆 盖80%以上的案例 Ø 腾讯云,承担每天数亿的图像审核, 已经 累计支持上百家客户。 Ø 微云,QQ群,支持视频识别的解决方案, 成熟灵活的产品方案,帮助业务扫除掉互 联网暴力、恐怖内容,有效的降低业务风 险。 l 暴恐识别技术 武装份子 管制刀具 枪支弹药 人群聚集 火灾 血腥 极端主义、恐怖主义标识 SACC2017 xx-arm-gpu-sdk.c xx-android-arm.c xx-randroid-sdk.java xx-ios-arm-sdk.m xx-x86-sdk.cpp Rapidnet : 深度网络应用的解决方案 • 将深度网络SDK生成,分为解析,编译,运行三个阶段 • 一键生成深度学习SDK,一个模型到处应用 加快应用速度 - RapidNet Ncnn : 移动端前向网络开源框 https://github0 码力 | 32 页 | 5.17 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112前 言 这是一本面向人工智能,特别是深度学习初学者的书,本书旨在帮助更多的读者朋友了 解、喜欢并进入到人工智能行业中来,因此作者试图从分析人工智能中的简单问题入手,一 步步地提出设想、分析方案以及实现方案,重温当年科研工作者的发现之路,让读者身临其 境式的感受算法设计思想,从而掌握分析问题、解决问题的能力。这种方式也是对读者的基 础要求较少的,读者在学习本书的过程中会自然而然地了解算法的相关背景知识,体会到知 进行了合并,弥补了 PyTorch 在工业部署方面的不足。 目前来看,PyTorch 和 TensorFlow 框架是业界使用最为广泛的两个深度学习框架, TensorFlow 在工业界拥有完备的解决方案和用户基础,但是 TensorFlow 2 和 TensorFlow 1.x 版本并不兼容,导致几乎所有基于 TensorFlow 1.x 开发的算法、框架等都需要修改甚至重 写,因此可以将 TensorFlow − ?(?)) 2 ? ?=1 其中?表示采样点的个数。这种误差计算方法称为均方误差(Mean Squared Error,简称 MSE)。 2.2 优化方法 现在来小结一下上述方案:目标是估计参数?和?,使得输入和输出满足线性关系 ?(?) = ??(?) + ?, ? ∈ [1, ?]。但是由于观测误差?的存在,需要通过采样多组数据样本对组 成的数据集(Dataset):0 码力 | 439 页 | 29.91 MB | 1 年前3
经典算法与人工智能在外卖物流调度中的应用• 配送效率 等餐时间、空驶距离、空闲骑士、 商圈压力 距离的节省: 订单组与骑士打分: 根据商圈压力调整: 3 分配方案 12 Greedy + 多轮KM算法分配方案 • Greedy分配解决特殊业务需求相关 • KM算法找到其余全局最优的分配方案 订单 骑士 订单 骑士 4 KM求解骑士和订单全局最优的分配 • 调度系统先对骑士和订单组(根据骑士的位置、身上的单量 单量 等)进行打分,得到订单组和骑士的打分矩阵,然后根据业 务需求优先分配指定订单,其他的则根据KM算法找到骑士和 订单的最优分配方案 KM算法 (1) 初始化可行标杆 (2) 用匈牙利算法寻找完备匹配 (3) 若未找到完备匹配则修改可行标杆 (4) 重复(2)(3)直到找到相等子图的完备匹配 供需平衡 13 5.1 配送时长预估模型 • 基于现有状况、订单增速、消 化速度、天气、当前手段等多 根据仿真系统及历史 大数据精细模拟在不 同单量不同骑士数量 下配送体验,预估在 天气变化、运营活动 订单激增等情况下合 理骑士人数 商圈健康度诊断 综合分析商圈内用户、 商户及骑士,提供线 下运营方案指导 寻宝系统 4 总结—物流系统生态是保证用户良好物流服务体验的基石 22 时光机 | 回顾过去 实时监控 | 监控现在 仿真系统 | 预测未来 寻宝系统 | 指导业务 调度系统0 码力 | 28 页 | 6.86 MB | 1 年前3
复杂环境下的视觉同时定位与地图构建MobileEye、特斯拉等自动驾驶方案 以廉价的摄像头为主 Google无人车项目Waymo 使用高精度激光雷达构建地图 SLAM应用介绍 • 虚拟/增强现实:Inside-Out方案 目前绝大多数VR头盔都采用 Outside-In的定位方案,需要在环境 中放置一个或多个传感器,活动范 围受限,不支持大范围移动的定位。 基于SLAM技术的VR/AR可以实现Inside-Out方案:将传感器固定在使用者端。 Google的Tango项目演示视频 Tango为终端开发者提供了从硬件到软件的整套AR开发套件 SLAM应用介绍 • 混合现实:微软HoloLens HoloLens融合了场景位置感知和头盔显示技术,并提供了完整的软硬件解决方案。 Hololens部分传感器 左右双目+前视RGB摄像头+深度传感器 Hololens宣传视频 视觉SLAM • 主要传感器 • 单目摄像头 • 双目摄像头 • 多目摄像头 • 其它辅助传感器0 码力 | 60 页 | 4.61 MB | 1 年前3
搜狗深度学习技术在广告推荐领域的应用CTR bagging • 任一模型的输出作为另一模型的特征输入 • 实现方法复杂,模型之间有依赖关系 • 实验方案较多,改进空间较大 模型融合 模型融合的工程实现 • 可支持多个不同模型的加载和计算 • 可支持模型之间的交叉和CTR的bagging • 可通过配置项随时调整模型融合方案 • 避免不必要的重复操作,减少时间复杂度 目标 • 模型本身也看做一个抽象特征 • 模型特征依赖于其它特征,通过计算得到新的特征 模型特征依赖于其它特征,通过计算得到新的特征 • 模型特征输出可作为CTR,也可作为特征为其它模型使用 • 限定ModelFeature的计算顺序,即可实现bagging/模型交叉等功能 解决方案(引入ModelFeature的概念) • 数据一致性 • 流程稳定 关键点 模型融合 PV Click Session Sample OneHot 特征 LR Train Ctr特征/模 型中间结果 模型效果评估 AUC 上线收益 是否一致? Survival Bias 特征覆盖率 并行化训练 并行化训练 诉求 加大数据量,提 升模型稳定性 加大数据量,提 升模型收益 方案 MxNet支持多机 多卡, 使用成本低 构 建 多 机 多 卡 GPU集群,优化 训练效率,提高 加速比 现状和计划 现状 已经实现LR+DNN融合模型的上线,收益较好0 码力 | 22 页 | 1.60 MB | 1 年前3
深度学习在电子商务中的应用聊天机器人主要模块及架构 深度学习探索 聊天机器人评测结果 6 • 语义词汇差异 理发器, 理发推子, 电推子 血糖计, 血糖仪 山地车,死飞,自行车,碟刹,折叠车,公路车, 单车 • 解决方案 同义词 ? 归一化 ? 預報 =》预报, 五岁 =》 5岁 目前商品搜索中的一些问题 7 人工智能/深度学习在搜索中的应用:网页/电商搜索 • 基于深度学习的(Query, Do 词语矢量考虑了上下文及词语之间的语义关系 复杂词语可以通过矢量计算来实现(如 Vec(北京)= vec(东京) – vec(日本) + vec(中国) ) 矢量化模型的现况 词语的矢量化模型已经有开源实现方案 句子和文档的矢量化还在摸索阶段,尚不成熟 已经有一些在词语相似度,舆情分析等方面的应用 矢量化搜索模型 9 词语矢量化模型 CBOW: 通过上下文词语 来预测词语本身出现的概 率 15 • 该技术不仅召回与搜索词完全匹配的结果,还可召回与搜索词文本不匹配、但含义近似的结果。 效果示例 如:经测评,当搜索词为“松下筒灯”, 易购网站返回6个相关结果, 美研方案返回64个相关结果 现有方案 原型系统 16 • 首先进行词语的矢量化 • 词语矢量作为各种深度学习模型的输入值 • 示例深度学习架构: dual RNN ( dual LSTM) • 利用用户反馈数据来补充训练样本0 码力 | 27 页 | 1.98 MB | 1 年前3
动手学深度学习 v2.0(3)将模型拟合数据的优化算法; (4) 能够有效训练模型、克服数值计算缺陷并最大限度地利用现有硬件的工程方法。同时教授表述问题所需的批 判性思维技能、解决问题所需的数学知识,以及实现这些解决方案所需的软件工具,这是一个巨大的挑战。 在我们开始写这本书的时候,没有资源能够同时满足一些条件:(1)是最新的;(2)涵盖了现代机器学习的 所有领域,技术深度丰富;(3)在一本引人入胜的教科书中, ai/t/2089 目录 15 16 目录 1 引言 时至今日,人们常用的计算机程序几乎都是软件开发人员从零编写的。比如,现在开发人员要编写一个程序 来管理网上商城。经过思考,开发人员可能提出如下一个解决方案:首先,用户通过Web浏览器(或移动应 用程序)与应用程序进行交互;紧接着,应用程序与数据库引擎进行交互,以保存交易历史记录并跟踪每个 用户的动态;其中,这个应用程序的核心——“业务逻辑”,详细说明了应用程序在各种情况下进行的操作。 编写一个应用程序,接受一张图像,识别出该图像所包含的人,并在每个人周围绘制轮廓; • 编写一个应用程序,向用户推荐他们可能喜欢,但在自然浏览过程中不太可能遇到的产品。 在这些情况下,即使是顶级程序员也无法提出完美的解决方案,原因可能各不相同。有时任务可能遵循一种 随着时间推移而变化的模式,我们需要程序来自动调整。有时任务内的关系可能太复杂(比如像素和抽象类 别之间的关系),需要数千或数百万次的计算。即使人类的眼睛能毫不费力地完成这些难以提出完美解决方0 码力 | 797 页 | 29.45 MB | 1 年前3
共 22 条
- 1
- 2
- 3













