Distillation - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

2020美团技术年货算法篇

裁剪和知识蒸馏方式效果对比在美团搜索核心排序的业务场景下，我们采用知识蒸馏使得 BERT 模型在对响应时间要求苛刻的搜索场景下符合了上线的要求，并且效果无显著的性能损失。知识蒸馏（Knowledge Distillation）核心思想是通过迁移知识，从而通过训练好的大模型得到更加适合推理的小模型。首先我们基于 MT-BERT（12 Layers），在大规模的美团点评业务语料上进行知识蒸馏得到通用的 MT-BERT Knowledge in a Neural Network. 2015. [7] Yew Ken Chia et al.Transformer to CNN: Label-scarce distillation for efficient text classification. 2018. [8] K-BERT: Enabling Language Representation with

0 码力 | 317 页 | 16.57 MB | 1 年前
3
2022年美团技术年货合辑

2 YOLOv6 量化感知蒸馏框架针对 YOLOv6s，我们选择对 Neck（Rep-PAN）输出的特征图进行通道蒸馏（channel-wise distillation, CW)。另外，我们采用“自蒸馏”的方法，教师模型是 FP32 精度的 YOLOv6s，学生模型是 INT8 精度的 YOLOv6s。下图 7 是一个简化示意图，只画出了 Neck Nsight-systems: https://docs.nvidia.com/nsight-systems/UserGuide/index.html [6] Channel-wise Knowledge Distillation for Dense Prediction, https://arxiv.org/ abs/2011.13256 [7] YOLOv6: A Single-Stage Object Detection https://tech.meituan.com/2021/07/08/multi-business-modeling.html. [7] Tang, Jiaxi, and Ke Wang. “Ranking distillation: Learning compact ranking models with high performance for recommender system.” Proceedings

0 码力 | 1356 页 | 45.90 MB | 1 年前
3

共 2 条前往

页

2020 美团技术年货算法 2022 合辑

分类

语言

格式

2020美团技术年货算法篇

2022年美团技术年货合辑

分类

语言

格式

2020美团技术年货 算法篇

2022年美团技术年货 合辑

2020美团技术年货算法篇

2022年美团技术年货合辑