Keras: 基于 Python 的深度学习库VII 7.2.14 cosine_proximity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 8 评估标准 Metrics 137 8.1 评价函数的用法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . y_train, epochs=5, batch_size=32) 或者,你可以手动地将批次的数据提供给模型: model.train_on_batch(x_batch, y_batch) 只需一行代码就能评估模型性能: loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128) 或者对新的数据生成预测: classes = model categorical_crossentropy 或 mse,也可以是一个目标函数。详见:losses。 • 评估标准 metrics。对于任何分类问题,你都希望将其设置为 metrics = ['accuracy']。 评估标准可以是现有的标准的字符串标识符,也可以是自定义的评估标准函数。 # 多分类问题 model.compile(optimizer='rmsprop', loss=0 码力 | 257 页 | 1.19 MB | 1 年前3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博• 相关系数评估 • 特征组合 • GBDT+互信息——有效挖掘 非线性特征及组合 皮尔逊相关系数特征评估 标签匹配度特征相关系数特征评估 样本采集 Ø 存在问题 • 头部效应 • 实时反馈类收集与在线存在差异性 Ø 解决方案 • 正负样本比例严重失衡 • 对头部曝光进行降采样,长尾曝光上采样 • 负样本进行下采样 • 后端样本预采样 模型评估 Ø 离线评估 • AUC AUC / wAUC Ø 在线评估 • 离线评估与线上效果正相关? • A/B test测试 • 分目标人群测试:地域、活跃度… A B 小流量-实验组 小流量-对照组 数据对比分析 算法架构 互动行为 点击行为 阅读行为 能力标签 兴趣标签 亲密度 自然属性 账号属性 用户特征 关键词 类型属性 topic 内容标签 内容质量 内容特征 组合特征 标签匹配度 用户互动率 协同特征 实时互动率 app互动率 微博内容 关注数据 用户信息 视觉标签 打码日志 社交关系 用户特征 发博流 互动流 曝光流 模型服务 模型训练 模型优化 模型评估 模型预测 CTR预估 排序策略 权值映射 业务排序 其他策略 特征工程 特征存储 特征查询 实时数据 自解释特征 1 2 3 深度学习应用与实践 常规CTR方法排序 微博Feed流排序场景介绍0 码力 | 21 页 | 2.14 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波实时数据 3 在线机器学习 实时样本 实时模型训练 实时更新参数 Task 训练预处理 Node 实时样本拼接 Node 在线模型训练 Node 离线样本拼接 Node 在线模型评估 Node 模型上线 Node 实时特征处理 Node 离线特征处理 Task Kafka输入 input process process output WeiFlow 工作流 标签UDF 3.样本过滤 4.特征过滤 模型训练 1.支持回归和分类 2.支持LR、FM、 DeepFM等模型 3.支持SGD 、 FTRL 、 Adagrad等优化算法 模型评估 1.独立模型评估 2.配置化 3.UI展示 3 在线机器学习-实时模型训练 • 模型选择 • LR : 基础模型,对特征工程依赖较强 • FM:大规模稀疏数据下的特征组合问题 • DeepFM … verson1 verson2 … kubenetes/olsubmit 模型库 3 在线机器学习-模型服务部署 • 模型评估 • 模型上线部署前指标评估 • 周期使用验证样本进行点击率预估 • 待部署模型与线上模型进行指标对比,评估是否满足上线条件 • 一键部署 • 基于K8S的deployment模式,一键端口分配与模型服务部署 • 基于ZK的服务发现,一键进行流量灰度与发布0 码力 | 36 页 | 16.69 MB | 1 年前3
动手学深度学习 v2.0信息论基础 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 3.4.8 模型预测和评估 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 3.5 图像分类数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 9.7.6 预测序列的评估 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 9.8 束搜索 . . . . . . 2.2 加载预训练的词向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 710 15.2.3 训练和评估模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 710 15.3 情感分析:使用卷积神经网络0 码力 | 797 页 | 29.45 MB | 1 年前3
《TensorFlow 2项目进阶实战》4-商品检测篇:使用RetinaNet瞄准你的货架商品目标检测问题 目标检测评估:Ground Truth 目标检测评估: Intersection over Union (IoU) 目标检测评估:Intersection over Union (IoU) Bounding Box Ground Truth ??? = ???????????? ????? = Bounding Box Ground Truth 目标检测评估:准确率与召回率(以GT为中心) 目标检测评估:准确率与召回率(以GT为中心) 目标检测评估:mean Average Precision(mAP) 基础:深度学习在目标检测的应用 目标检测近20年发展 Ref: Zou, Z., Shi, Z., Guo, Y. and Ye, J., 2019. Object detection in 20 years: A survey. arXiv preprint arXiv:1905.05055. 目标检测近20年里程碑0 码力 | 67 页 | 21.59 MB | 1 年前3
经典算法与人工智能在外卖物流调度中的应用调度系统算法 1 2 3 4 5 路线规划 • 动态规划最优配送路线,且合理 并单,以最低的配送成本最大化 满足用户配送体验。 • 考虑用户期望时间的TSP问题 • 构建模型综合评估用户体验与配 送成本打分 • 采用动态规划和模拟退火算法等 算法,求得最优路线 1 8 时间预估 用户下单 开始配送 骑士到店 骑士取餐 到达用户 完成交付 商户接单 商户出餐 到店时间 借助机器学习与深度学习实现,骑士到店时 间、等餐时间、骑士到用户时间、交付用户 时间等配送全流程节点时间预估 动态规划最优配送路线,且合理并单,以最 低的配送成本最大化满足用户配送体验。 建立配送成本及用户体验的评估模型,并基于多 场景多维度权衡骑士和待分配订单匹配程度 依据评价模型得出的订单和骑士匹配程 度,全局最优进行整体调度分配 借助机器学习实现精准的配送时长预估,预 测不同价格杠杆的效果,满足用户体验的情 智能调度系统的分析监控 17 • 真实再现调度场景细节 • 回溯定位异常调度原因,诊断调试算法 • 实时获取调度监控指标 • 及时预警引入人工干预 • 精准模拟实际订单分布情况 • 有效评估调度算法的改进效果 • 合理划分物流范围 • 节省调度运力,提升商户配送能力 • 云端虚拟队列,实现调度指派 • 提升物流效率 仿真系统 实时监控 时光机 寻宝系统 1 2 3 40 码力 | 28 页 | 6.86 MB | 1 年前3
《TensorFlow 2项目进阶实战》5-商品识别篇:使用ResNet识别你的货架商品基础:图像分类问题定义与说明 图像分类问题 语义级分类 细粒度分类 图像分类问题 实例级分类 识别问题 图像分类问题 实例级分类 识别问题 图像分类问题 图像分类评估:Top-1 / Top-5 准确率 图像分类评估:混淆矩阵 图像分类评估:ROC 曲线 基础:越来越深的图像分类网络 历年 SOTA 模型对比 AlexNet(2012) AlexNet(2012) AlexNet(2012)0 码力 | 58 页 | 23.92 MB | 1 年前3
机器学习课程-温州大学-07机器学习-决策树15} {7,15} {1,2,3,14} 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 剪枝决策树。 C4.5 采用的悲观剪枝方法,用递归的方式从低往上针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 本上的错误率。 C4.5的剪枝 后剪枝 后剪枝的决策树 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 剪枝决策树。 C4.5 采用的悲观剪枝方法,用递归的方式从低往上针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 本上的错误率。 而 得到的,这一系列树中的最后一棵树仅含一个用来预测类别的叶节点。然后用一 种成本复杂度的度量准则来判断哪棵子树应该被一个预测类别值的叶节点所代替 。 这种方法需要使用一个单独的测试数据集来评估所有的树,根据它们在测试数据 集熵的分类性能选出最佳的树。 36 CART算法 CART剪枝 具体流程: (1)计算每一个结点的条件熵 (2)递归的从叶子节点开始往上遍历, 减掉叶子节点0 码力 | 39 页 | 1.84 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言用于描述和解决智能体(agent)在与环境的交 互过程中通过学习策略以达成回报最大化或实现 特定目标的问题 。 2. 机器学习的类型-强化学习 19 ✓ 机器学习方法 ✓ 模型 ✓ 损失函数 ✓ 优化算法 ✓ 模型评估指标 机器学习的概念 20 机器学习的概念-模型 机器学习首先要考虑使用什么样的模型。 模型的类别,大致有两种:一是概率模型(Probabilistic Model)和非概率模型 (Non-Probabilistic 等。具体 的算法,我们会在各自章节中介绍。其中本课程中,用梯度下降法作为主要的 优化算法。 26 机器学习的概念-模型评估 当损失函数给定时,我们将基于模型训练数据的误差(Training Error)和测试数据的 误差(Testing Error)作为模型评估的标准。 测试误差的具体定义为:????? = 1 ?′ ?=1 ?′ L ??, መ? ?? 其中,?′为测试数据数量,L(0 码力 | 78 页 | 3.69 MB | 1 年前3
机器学习课程-温州大学-机器学习项目流程数据搜集 数据清洗 特征工程 数据建模 6 机器学习的一般步骤 数据搜集 数据清洗 特征工程 数据建模 • 基于性能指标比较几种机 器学习模型 • 对最佳模型执行超参数调 整 • 在测试集上评估最佳模型 • 解释模型结果 • 得出结论 • 数据清理和格式化 • 探索性数据分析(EDA) • 特征工程 • 特征选择 • 网络下载 • 网络爬虫 • 数据库读取 • 开放数据 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 24 数据建模 • 基于性能指标比较几种机器学习模型 • 对最佳模型执行超参数调整 • 在测试集上评估最佳模型 • 解释模型结果 • 得出结论 25 参考文献 1. https://github.com/WillKoehrsen/machine-learning-project- walkthrough0 码力 | 26 页 | 1.53 MB | 1 年前3
共 22 条
- 1
- 2
- 3













