房源质量打分 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

房源质量打分中深度学习应用及算法优化-周玉驰

COM ALL COPYRIGHTS RESERVED 3 自我介绍周玉驰  硕士毕业于中科院  先后就职于华为，百度和医渡云  目前就职于贝壳找房  主要负责两个方向  房源策略算法  房客人关系图谱扫一扫二维码图案，加我微信 2019 KE.COM ALL COPYRIGHTS RESERVED 4 目录  为什么要做AI选房  如何做AI选房  COPYRIGHTS RESERVED 6 贝壳找房发展&挑战 20万经纪人 98 门店平均房源 2.1万门店 10-25 经纪人熟悉房源 70% 跨店成交占比 1.87亿房屋 3000万月活跃用户 • 需要强大的房源质量盘点工具 • 找到好房难度大，成本高挑战 200万贝壳全部房源 2019 KE.COM ALL COPYRIGHTS RESERVED 7 目标&价值 • 无法盘点所有房源质量存在问题人工选房流程 2019 KE.COM ALL COPYRIGHTS RESERVED 9 AI选房本质上是TopN排序问题 2019 KE.COM ALL COPYRIGHTS RESERVED 10 AI选房 - 房源质量打分   好房定义 AI选房建模 Y = f (X)  Y：未来？天能否成交  X：最近？天房源产生的所有行为

0 码力 | 48 页 | 3.75 MB | 1 年前
3
微服务架构及ServiceComb实践

https://github.com/apache?q=servicecomb 服务间的通信背景：为什么服务间通信重要？ • 每个微服务有自己的数据库（层） • 服务架构应用的质量很大程度取决于服务的拆分的高内聚，低耦合，不了解服务间通信，无法做出高质量的拆分。不同的业务，涉及的不同的服务间通信有不同的要求 1. 关注事务性要求（ACID） 2. 关注对性能的要求举例：商品维护和下订单是2个微服务，下订声誉和法律风险。 4. 抢购体验  商家的技术能力  产品质量。 [社区网站] http://servicecomb.apache.org [Github ] https://github.com/apache?q=servicecomb 一个电商抢房系统举例简介从一个简单的电商Demo开始。背景：开发商开盘时，让客户“抢购”其当前推售的所有房源，先抢到先得。客户管理 Customer- User-center 认证鉴权 login 管理客户的基本信息，录入客户的选房资格。管理楼盘的基本信息，楼盘 1-n 楼栋 1-n 房源。管理开售活动，进行开售时的抢购用户查看自己的开售活动和抢房资格，管理查看收藏的房源，查看自己的抢房结果。用户和管理员登录/修改密码等功能。可扩展为多种登录方式。 [社区网站] http://servicecomb.apache

0 码力 | 14 页 | 2.04 MB | 1 年前
3
使用微服务架构快速开发万级TPS高可用电商系统

背景：开发商开盘时，让客户“抢购”其当前推售的所有房源，先抢到先得。客户管理 customer- manage 楼盘管理 realestate 抢购/下订单 house-order 用户中心 user-center 认证鉴权 login 管理客户的基本信息，录入客户的选房资格。管理楼盘的基本信息，楼盘 1-n 楼栋 1-n 房源。管理开售活动，进行开售时的抢购用户查看自己的开售活动和用户查看自己的开售活动和抢房资格，管理查看收藏的房源，查看自己的抢房结果。用户和管理员登录/修改密码等功能。可扩展为多种登录方式。 [社区网站] http://servicecomb.apache.org [Github ] https://github.com/apache?q=servicecomb 从客户管理应用谈起—简单性表内容关键字段 customers 存客户的基本信息，包括名字，联系方式等 https://github.com/apache?q=servicecomb 服务间的通信背景：为什么服务间通信重要？ • 每个微服务有自己的数据库（层） • 服务架构应用的质量很大程度取决于服务的拆分的高内聚，低耦合，不了解服务间通信，无法做出高质量的拆分。不同的业务，涉及的不同的服务间通信有不同的要求 1. 关注事务性要求（ACID） 2. 关注对性能的要求举例：客户维护和订单是2个微服务，订单系

0 码力 | 15 页 | 1.46 MB | 1 年前
3
2022年美团技术年货合辑

工程效能 CI/CD 之流水线引擎的建设实践 912 美团外卖搜索基于 Elasticsearch 的优化实践 933 美团图灵机器学习平台性能起飞的秘密（一） 953 提升资源利用率与保障服务质量，鱼与熊掌不可兼得？ 971 标准化思想及组装式架构在后端 BFF 中的实践 992 外卖广告大规模深度学习模型工程实践 | 美团外卖广告工程实践专题连载 1013 数据库全量 SQL 分析与审计系统性能优化之旅美团集群调度系统的云原生实践 1149 广告平台化的探索与实践 | 美团外卖广告工程实践专题连载 1161 数据 1193 Kafka 在美团数据平台的实践 1193 美团综合业务推荐系统的质量模型及实践 1218 业务数据治理体系化思考与实践 1233 数据治理一体化实践之体系化建模 1263 vi > 2022年美团技术年货运维 / 安全 1277 数字化新业态下数据安全创新——Token 的实验调研，我们发现，相较于算法 < 9 Anchor-based 检测器的复杂度而带来的额外延时，Anchor-free 检测器在速度上有 51% 的提升。 SimOTA 标签分配策略为了获得更多高质量的正样本，YOLOv6 引入了 SimOTA [4] 算法动态分配正样本，进一步提高检测精度。YOLOv5 的标签分配策略是基于 Shape 匹配，并通过跨网格匹配策略增加正样本数量，从而使

0 码力 | 1356 页 | 45.90 MB | 1 年前
3
2023 中国开源开发者报告

Midjourney 这两大图像生成系统的出现，极大地拓展和加速了 LLM 在计算机视觉领域的应用，它们突破了传统图像生成方式的局限，仅需要用户提供文字描述，就可以生成高质量的数字艺术作品。它们的图像生成质量、样式多样性和用户便捷性都是极大的突破。这为广大的个人用户和创意行业提供了强有力的工具，彻底改变了数字艺术内容的创作方式。同时，它们也引发了人工智能在创作领域的伦理和法律讨论。LLM 2023 年 10 月，百川智能发布 Baichuan2-192K 大模型，上下文窗口长度高达 192K，号称是当时全球最长的上下文窗口，能够处理约 35 万个汉字。在上下文窗口长度、长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面的表现均全面领先 Claude2。 2023 年 9 月，蚂蚁集团正式开源代码大模型 CodeFuse——基于蚂蚁基础大模型研发。这是蚂蚁自研的代码生成专属年 12 月，有 “欧洲版 OpenAI” 之称的大模型创业公司——Mistral AI 用「磁链链接」开源了 87 GB 的 8x7B MoE 模型：Mixtral 8x7B。这是一个开放权重的高质量稀疏混合专家模型(SMoE)，采用 Apache 2.0 License 开源。在大多数基准测试中，Mixtral 的成绩都优于 Llama 2-70B，且推理速度提升了 6 倍。而且在大多数标准基准测试中超过

0 码力 | 87 页 | 31.99 MB | 1 年前
3
2019-2021 美团技术年货前端篇

体验，提供的服务包括民宿、酒店、公寓、客栈、短租、宾馆、旅行住宿等，同时包括树屋、房车、INS 风等新奇的网红民宿。美团民宿自上线之后，业务发展迅猛，在供给侧，房源类型不断丰富，各类分销、直销、直连、境外陆续推出，房源信息维度不断扩展，筛选、推荐、信息呈现也不断变得复杂。同时伴随着营销方式的丰富、房东管理、经营、服务的不断扩充，民宿的业务也越来越复杂。美团民宿大前端伴随业务的发展不断自我迭代，移动需求，以用户留存、用户认知、用户体验为主，两者在产品功能上存在较大的差异，如何恰当地处理产品差异化问题是跨端复用的场景下的一个重要挑战。 ● 跨端复用质量隐患：实现了复用便要考虑两端的各种兼容性问题，这就会产生各种质量上的隐患。如何在复用组件不断迭代中，保障组件接口、输入、输出的兼容性问题？如何保障各个复用组件底层依赖的统一、适配层接口的统一？双端复用场景下，如何更好的做孕育而生，同需解决。 3.2 跨端复用应用架构为了解决跨端复用在业务实践中遇到的各种问题，我们重新设计了跨端复用应用架构，从架构分层管理、复用方式设计、流程规范、质量保障方面入手，重点解决跨端差异化、质量隐患、流程规范各种问题，并寻求复用的最大化和性能上的均衡。 174 > 2021年美团技术年货 3.2.1 跨端复用应用架构演进在这里，先贴出动态的架构演进过程，让大家有一个宏观的认识。我们先简单地描述

0 码力 | 738 页 | 50.29 MB | 1 年前
3
动手学深度学习 v2.0

在我们开始写这本书的时候，没有资源能够同时满足一些条件：（1）是最新的；（2）涵盖了现代机器学习的所有领域，技术深度丰富；（3）在一本引人入胜的教科书中，人们可以在实践教程中找到干净的可运行代码，并从中穿插高质量的阐述。我们发现了大量关于如何使用给定的深度学习框架（例如，如何对TensorFlow中的矩阵进行基本的数值计算)或实现特定技术的代码示例（例如，LeNet、AlexNet、ResNet的代码片段），这如，亚马逊上的产品评级和评论。在其他一些情况下，客户会提供隐性反馈。例如，某用户跳过播放列表中的某些歌曲，这可能说明这些歌曲对此用户不大合适。总的来说，推荐系统会为“给定用户和物品”的匹配性打分，这个“分数”可能是估计的评级或购买的概率。由此，对于任何给定的用户，推荐系统都可以检索得分最高的对象集，然后将其推荐给用户。以上只是简单的算法，而工业生产的推荐系统要先进得多，它会将详细的用户活动和项目特征考虑引言图1.3.4: 亚马逊推荐的深度学习书籍尽管推荐系统具有巨大的应用价值，但单纯用它作为预测模型仍存在一些缺陷。首先，我们的数据只包含“审查后的反馈”：用户更倾向于给他们感觉强烈的事物打分。例如，在五分制电影评分中，会有许多五星级和一星级评分，但三星级却明显很少。此外，推荐系统有可能形成反馈循环：推荐系统首先会优先推送一个购买量较大（可能被认为更好）的商品，然而目前用户的购买

0 码力 | 797 页 | 29.45 MB | 1 年前
3
经典算法与人工智能在外卖物流调度中的应用

2 3 4 5 路线规划 • 动态规划最优配送路线，且合理并单，以最低的配送成本最大化满足用户配送体验。 • 考虑用户期望时间的TSP问题 • 构建模型综合评估用户体验与配送成本打分 • 采用动态规划和模拟退火算法等算法，求得最优路线 1 8 时间预估用户下单开始配送骑士到店骑士取餐到达用户完成交付商户接单商户出餐到店时间出餐时间送餐时间 DNN对特征工程要求较低，自身可以学习有用的特征，PCA降维影响较小，但时间复杂度较高 • XGBoost模型 - 采用近似求解算法，找出可能的分裂点，避免选用贪心算法的过高时间复杂度 - 计算采用不同分裂点时，叶子打分函数的增益；并选择增益最高的分裂点，作为新迭代树的最终分裂节点，构造新的迭代树 - 通过调节迭代树数目、学习倍率、迭代树最大深度、L2正则化参数等进一步避免过拟合 2 获取样本数据过滤数据距离的节省：订单组与骑士打分：根据商圈压力调整： 3 分配方案 12 Greedy + 多轮KM算法分配方案 • Greedy分配解决特殊业务需求相关 • KM算法找到其余全局最优的分配方案订单骑士订单骑士 4 KM求解骑士和订单全局最优的分配 • 调度系统先对骑士和订单组（根据骑士的位置、身上的单量等）进行打分，得到订单组和骑士的打分矩阵，然后根据业务需

0 码力 | 28 页 | 6.86 MB | 1 年前
3
百度超级链 XuperChain 3.7 中文文档

场景是什么？环签名、零知识证明等技术适用于对隐私保护有较高需求的网络中。目前环签名已经在crypto模块中开源，可以实现对交易发起者信息的混淆，例如在论文评审场景里，实现评审者对论文的匿名打分等；零知识证明目前尚未开源。超级链有区块链浏览器吗？暂时没有，在计划中，敬请关注。什么是VAT，它的作用是什么？ VAT (Verifiable Auto-generated Transaction 于工作组、社区以及合作伙伴；同时，工作组会对收集来的需求进行可行性、优先级评审；之后，开发者在github上选择感兴趣的需求进行设计并形成文档；再之后，即可以发起实际的代码开发流程；为了提高代码的质量，需要同时编写单元测试。如何快速参与超级链的需求开发？为了方便开发者更快地参与超级链的需求开发，超级链工作组已经将一些待开发的需求推到 github [https://github.c

0 码力 | 270 页 | 24.86 MB | 1 年前
3
2.2.4 基于Kubernetes的私有云实战

Problem K8S的调度原理 K8S的调度原理调度器调度⼀个 Pod 的过程分为两个阶段：调度周期和绑定周期调度周期 • 选择符合条件的Node （硬性选择） • 给Node打分（软性选择）绑定周期 • 向binding接⼝发送Post请求，把结果告诉k8s  基于CPU实时使⽤率的调度器借助Scheduling Framework可以实现⾃定义的调度器

0 码力 | 47 页 | 10.67 MB | 1 年前
3

共 489 条前往

页

分类

语言

格式

房源质量打分中深度学习应用及算法优化-周玉驰

微服务架构及ServiceComb实践

使用微服务架构快速开发万级TPS高可用电商系统

2022年美团技术年货合辑

2023 中国开源开发者报告

2019-2021 美团技术年货前端篇

动手学深度学习 v2.0

经典算法与人工智能在外卖物流调度中的应用

百度超级链 XuperChain 3.7 中文文档

2.2.4 基于Kubernetes的私有云实战