搜狗深度学习技术在广告推荐领域的应用限定ModelFeature的计算顺序,即可实现bagging/模型交叉等功能 解决方案(引入ModelFeature的概念) • 数据一致性 • 流程稳定 关键点 模型融合 PV Click Session Sample OneHot 特征 LR Train Ctr特征/模 型中间结果 DNN Train Feature Maker One Case ALL One0 码力 | 22 页 | 1.60 MB | 1 年前3
PyTorch Brand Guidelines(Digital+Print) White (Digital+Print) Super Light Gray— Hover State (Digital) Super Light Gray— Click State (Digital) Light Light Gray (Digital+Print) Light Gray (Digital+Print) Medium Gray0 码力 | 12 页 | 34.16 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱模型的⼤⼩由什么决定? Key + embedding values 痛点: 1. 更少的values: 变⻓Embedding 特征出现次数少,⽤1个float 结合show/click,有效果提升 2. 更少的key: group lasso key级别的稀疏化 3. 更短的values a) 混合精度: float16+int8+int4 b) 量化压缩,1bit或2bit0 码力 | 22 页 | 6.76 MB | 1 年前3
阿里云上深度学习建模实践-程孟力hrnet, mobilenet, transformer? 多任务模型: share-bottom, mmoe, ple? 特征选择/生成: Age, sex, comment, click… 解决方案: 超参搜索 效果提升 模型理解 问题: 黑盒 1. 参数太多 / 参数敏感 2. 候选空间大 3. 场景数据相关 模型创新 2.模型效果优化 模型效果优化: 超参数搜索NNI0 码力 | 40 页 | 8.51 MB | 1 年前3
《Efficient Deep Learning Book》[EDL] Chapter 6 - Advanced Learning Techniques - Technical Reviewconventional distillation. For example on the natively binary classification task like Criteo’s ad click prediction problem where the subclass technique achieves the same accuracy as a student with vanilla0 码力 | 31 页 | 4.03 MB | 1 年前3
共 5 条
- 1













