 房源质量打分中深度学习应用及算法优化-周玉驰… 时序特征 21维 提取函数 8个 提取特征 168维 2019 KE.COM ALL COPYRIGHTS RESERVED 19 v1.0 - 小结 存在的问题 新上房源与库存房源在行为特征上 差异巨大 引入新上房源,会严重干扰模型  很难兼容新上房源  时序数据特征爆炸 时序特征进行特征提取,得到的特征 数量庞大 随着迭代的进行,新加入特征边际效 应递减,但是成本高 ??????????? )  分数映射公式 2019 KE.COM ALL COPYRIGHTS RESERVED 38 库存&新上房源 数量分布  新上房源分数略高 2019 KE.COM ALL COPYRIGHTS RESERVED 39 库存&新上房源 去化率  分数越高,质量越好 2019 KE.COM ALL COPYRIGHTS RESERVED 40 了解分0 码力 | 48 页 | 3.75 MB | 1 年前3 房源质量打分中深度学习应用及算法优化-周玉驰… 时序特征 21维 提取函数 8个 提取特征 168维 2019 KE.COM ALL COPYRIGHTS RESERVED 19 v1.0 - 小结 存在的问题 新上房源与库存房源在行为特征上 差异巨大 引入新上房源,会严重干扰模型  很难兼容新上房源  时序数据特征爆炸 时序特征进行特征提取,得到的特征 数量庞大 随着迭代的进行,新加入特征边际效 应递减,但是成本高 ??????????? )  分数映射公式 2019 KE.COM ALL COPYRIGHTS RESERVED 38 库存&新上房源 数量分布  新上房源分数略高 2019 KE.COM ALL COPYRIGHTS RESERVED 39 库存&新上房源 去化率  分数越高,质量越好 2019 KE.COM ALL COPYRIGHTS RESERVED 40 了解分0 码力 | 48 页 | 3.75 MB | 1 年前3
 QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒l云原生Cloud-Native超大规模视图存储、处理、检 索 l处理数万到数十万路,城市范围级别监控、门禁摄 像头数据 l10-100 Billion级别深度学习特征检索 - PB以上级别数据库存储 - 100PB级别抓拍图片存储 - 每秒万次并发检索请求 l大规模推广应用 l某种程度上说,城市内所有市民都是系统的用户 深度学习算法发展为平台系统赋能 首次超过人眼 2014 20150 码力 | 23 页 | 9.26 MB | 1 年前3 QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒l云原生Cloud-Native超大规模视图存储、处理、检 索 l处理数万到数十万路,城市范围级别监控、门禁摄 像头数据 l10-100 Billion级别深度学习特征检索 - PB以上级别数据库存储 - 100PB级别抓拍图片存储 - 每秒万次并发检索请求 l大规模推广应用 l某种程度上说,城市内所有市民都是系统的用户 深度学习算法发展为平台系统赋能 首次超过人眼 2014 20150 码力 | 23 页 | 9.26 MB | 1 年前3
 机器学习课程-温州大学-12机器学习-关联规则必然包括这商品本身) 40 3.FP-Growth算法 FP-Growth算法的优点 1.与Apriori算法相比,该算法只需对数据库进行两次扫描 2.该算法不需要对项目进行配对,因此速度更快。 3.数据库存储在内存中的压缩版本中。 4.对长、短频繁模式的挖掘具有高效性和可扩展性。 FP-Growth算法的缺点 1.FP-Tree比Apriori更麻烦,更难构建。 2.可能很耗资源。 3.当数据库较大时,算法可能不适合共享内存0 码力 | 49 页 | 1.41 MB | 1 年前3 机器学习课程-温州大学-12机器学习-关联规则必然包括这商品本身) 40 3.FP-Growth算法 FP-Growth算法的优点 1.与Apriori算法相比,该算法只需对数据库进行两次扫描 2.该算法不需要对项目进行配对,因此速度更快。 3.数据库存储在内存中的压缩版本中。 4.对长、短频繁模式的挖掘具有高效性和可扩展性。 FP-Growth算法的缺点 1.FP-Tree比Apriori更麻烦,更难构建。 2.可能很耗资源。 3.当数据库较大时,算法可能不适合共享内存0 码力 | 49 页 | 1.41 MB | 1 年前3
共 3 条
- 1













