房源质量打分中深度学习应用及算法优化-周玉驰COM ALL COPYRIGHTS RESERVED 3 自我介绍 周玉驰 硕士毕业于中科院 先后就职于华为,百度和医渡云 目前就职于贝壳找房 主要负责两个方向 房源策略算法 房客人关系图谱 扫一扫二维码图案,加我微信 2019 KE.COM ALL COPYRIGHTS RESERVED 4 目录 为什么要做AI选房 如何做AI选房 COPYRIGHTS RESERVED 6 贝壳找房发展&挑战 20万 经纪人 98 门店平均房源 2.1万 门店 10-25 经纪人熟悉房源 70% 跨店成交占比 1.87亿 房屋 3000万 月活跃用户 • 需要强大的房源质量盘点工具 • 找到好房难度大,成本高 挑战 200万 贝壳全部房源 2019 KE.COM ALL COPYRIGHTS RESERVED 7 目标&价值 • 无法盘点所有房源质量 存在问题 人工选房流程 2019 KE.COM ALL COPYRIGHTS RESERVED 9 AI选房本质上是TopN排序问题 2019 KE.COM ALL COPYRIGHTS RESERVED 10 AI选房 - 房源质量打分 好房定义 AI选房建模 Y = f (X) Y:未来?天能否成交 X:最近?天房源产生的所有行为0 码力 | 48 页 | 3.75 MB | 1 年前3
动手学深度学习 v2.0在我们开始写这本书的时候,没有资源能够同时满足一些条件:(1)是最新的;(2)涵盖了现代机器学习的 所有领域,技术深度丰富;(3)在一本引人入胜的教科书中,人们可以在实践教程中找到干净的可运行代码, 并从中穿插高质量的阐述。我们发现了大量关于如何使用给定的深度学习框架(例如,如何对TensorFlow中 的矩阵进行基本的数值计算)或实现特定技术的代码示例(例如,LeNet、AlexNet、ResNet的代码片段),这 如,亚马逊上的产品评级和评论。 在其他一些情况下,客户会提供隐性反馈。例如,某用户跳过播放列表中的某些歌曲,这可能说明这些歌曲 对此用户不大合适。总的来说,推荐系统会为“给定用户和物品”的匹配性打分,这个“分数”可能是估计 的评级或购买的概率。由此,对于任何给定的用户,推荐系统都可以检索得分最高的对象集,然后将其推荐 给用户。以上只是简单的算法,而工业生产的推荐系统要先进得多,它会将详细的用户活动和项目特征考虑 引言 图1.3.4: 亚马逊推荐的深度学习书籍 尽管推荐系统具有巨大的应用价值,但单纯用它作为预测模型仍存在一些缺陷。首先,我们的数据只包含“审 查后的反馈”:用户更倾向于给他们感觉强烈的事物打分。例如,在五分制电影评分中,会有许多五星级和一 星级评分,但三星级却明显很少。此外,推荐系统有可能形成反馈循环:推荐系统首先会优先推送一个购买 量较大(可能被认为更好)的商品,然而目前用户的购买0 码力 | 797 页 | 29.45 MB | 1 年前3
经典算法与人工智能在外卖物流调度中的应用2 3 4 5 路线规划 • 动态规划最优配送路线,且合理 并单,以最低的配送成本最大化 满足用户配送体验。 • 考虑用户期望时间的TSP问题 • 构建模型综合评估用户体验与配 送成本打分 • 采用动态规划和模拟退火算法等 算法,求得最优路线 1 8 时间预估 用户下单 开始配送 骑士到店 骑士取餐 到达用户 完成交付 商户接单 商户出餐 到店时间 出餐时间 送餐时间 DNN对特征工程要求较低,自身可以学习有用的特征,PCA降维影响较小,但时间复杂度较高 • XGBoost模型 - 采用近似求解算法,找出可能的分裂点,避免选用贪心算法的过高时间复杂度 - 计算采用不同分裂点时,叶子打分函数的增益;并选择增益最高的分裂点,作为新迭代树的最终分裂 节点,构造新的迭代树 - 通过调节迭代树数目、学习倍率、迭代树最大深度、L2正则化参数等进一步避免过拟合 2 获取样本数据 过滤数据 距离的节省: 订单组与骑士打分: 根据商圈压力调整: 3 分配方案 12 Greedy + 多轮KM算法分配方案 • Greedy分配解决特殊业务需求相关 • KM算法找到其余全局最优的分配方案 订单 骑士 订单 骑士 4 KM求解骑士和订单全局最优的分配 • 调度系统先对骑士和订单组(根据骑士的位置、身上的单量 等)进行打分,得到订单组和骑士的打分矩阵,然后根据业 务需0 码力 | 28 页 | 6.86 MB | 1 年前3
2.2.4 基于Kubernetes的私有云实战Problem K8S的调度原理 K8S的调度原理 调度器调度⼀个 Pod 的过程分为两个阶段:调度周期 和 绑定周期 调度周期 • 选择符合条件的Node (硬性选择) • 给Node打分 (软性选择) 绑定周期 • 向binding接⼝发送Post请求,把结果告诉k8s 基于CPU实时使⽤率的调度器 借助Scheduling Framework可以实现⾃定义的调度器0 码力 | 47 页 | 10.67 MB | 1 年前3
石油巨头与Kubernetes, Microservice & DevOps 共舞1114最终版DevOps过程中的安全问 题 项⺫管理 快速迭代开发,更短的发布周期, 并统⼀流程,规范化管理 持续交付 提⾼部署的效率,降低部署的⻛ 险,提⾼部署的质量,消除部⻔ 壁垒,交付过程标准化, 透明化 持续构建与测试 保障代码质量,提升开发效率 知识共享 知识共享与积累,不断完善,持 续学习改进 认证与改进 持续优化, 形成闭环 运维监控 运⾏状态可视化,数据化,降低 部署⻛险,快速反馈 流⽔线编 排⼯具 代码质 量管控 镜像安 全扫描 运营统 计⼯具 XXXX 指标统计 XXXX 指标统计 XXXX 指标统计 XXXX 指标统计 运营统计 编译打 包 代码质量 管理 多语⾔ 构建 安全管控 构建实 践 测试管理 功能测 试 性能测试 接⼝测 试 产出物管 理 持续构建与测试 ⾃动部 署 配置管理 环境管 理 数据库变 更 运维监 控 通知反馈 部署策 略 持续交付 ⼯具链 最佳实践 测试管理 规范 流⽔线建设 规范 敏捷开发 规范 流程协作与最 佳实践 项⺫管理 进度 管理 范围 管理 质量 管理 ⼈⼒ 管理 ⻛险 管理 沟通 管理 知识共享 知识 库建 设 ⽂档 协作 学习培训体系 培训规划建设 平台培训 ⼯具培训 培训效果评估 LAB 环境建设 标准案例建设0 码力 | 33 页 | 7.49 MB | 1 年前3
机器学习课程-温州大学-02-数学基础回顾-2.CS229-Prob概率论复习和参考 1. 概率的基本要素 1.1 条件概率和独立性 2. 随机变量 2.1 累积分布函数 2.2 概率质量函数 2.3 概率密度函数 2.4 期望 2.5 方差 2.6 一些常见的随机变量 3. 两个随机变量 3.1 联合分布和边缘分布 3.2 联合概率和边缘概率质量函数 3.3 联合概率和边缘概率密度函数 3.4 条件概率分布 3.5 贝叶斯定理 3.6 独立性 3 ,它将概率度量指定为: 通过使用这个函数,我们可以计算任意事件发生的概率。图1显示了一个样本CDF函数。 性质: 2.2 概率质量函数 当随机变量 取有限种可能值(即, 是离散随机变量)时,表示与随机变量相关联的概率度量的更简单 的方法是直接指定随机变量可以假设的每个值的概率。特别地,概率质量函数(PMF)是函数 ,这样: 在离散随机变量的情况下,我们使用符号 表示随机变量 可能假设的一组可能值。例如,如果 )的硬币第一次掷出正面所需要的次数。 泊松分布:用于模拟罕见事件频率的非负整数的概率分布(其中: )。 图2:一些随机变量的概率密度函数(PDF)和累积分布函数(CDF) 分布 概率密度函数(PDF)或者概率质量函数 (PMF) 均 值 方差 (伯努利分布) (二项式分 布) 其中: (几何分布) 其中: 连续随机变量 均匀分布:在 和 之间每个点概率密度相等的分布(其中: )。0 码力 | 12 页 | 1.17 MB | 1 年前3
企业云原生的探索与落地深圳沙龙-RacherLabs-20-11-14/安信证券DevOps探索与实践01 工具平台建设 02 试点项目实践 03 目录 CONTENTS 持续改进 04 目标:以研发团队为中心,在端到端流程串联、流程自动化、度量精化、质量增强、资源自助化几个重点方面发力, 打造研发管理平台,提供具备快速交付、高质量、过程透明、可度量的IT研发服务供应链。 证券业务的复杂性: 证券业务种类多,业务规则复杂,业 务链条长,业务发展快速,监管严格, 面向客户类型多,证券业务的多样性 性能测试 安全 部署 Jmeter Xray Ansible 测试平台 分 析 与 度 量 基础设施 开发环境 SIT环境 UAT环境 生产环境 战略目标 效率 质量 成本 安全 配置管理 落地实践 持续集成 内建质量 部署与发布管理 度量与反馈 工具平台建设-流水线过程 工具平台建设-综合门户 Jira Confluence Jenkins 测试平台 Maven Junit maven sonar-cli ansible npm jnlp-slave docker sonar-cli jnlp-slave gradle sonar-cli 试点项目实践-内建质量 单元测试 接口测试 系统测试 构建 集成 SIT UAT 单元测试 代码扫描 API自动化测试 UI自动化测试 安全测试 性能测试 关键检查点 定义指标 自动化检查 ⚫0 码力 | 27 页 | 2.42 MB | 1 年前3
云计算白皮书国将云计算看作抢占新一轮科技革命制高点的关键环节。云计算巨 头厂商在全球化布局基础上,纷纷调整发展重心,并聚焦热点区域、 热点领域和热点方向,试图在市场上抢得先机。 四是云计算技术不断推陈出新,助力产业高质量发展。随着上 云进程持续加深,企业需求逐步向用云转移,效率、性能、安全等 成为用户关注点,应用现代化、一云多芯、平台工程、云成本优化、 系统稳定性、云原生安全等新技术层出不穷,满足用户多样性场景 培育数据新要素,推动形成数字贸 易引领优势,大力发展云服务、数 字服务、跨境电子商务等数字贸 易;提升数字新基建,大力发展云 原生产业。 广东 (深圳) 2023.5 《深圳经济特区质量条例》 推动移动互联、大数据、云计算、 物联网等与各行各业相融合,催生 产业新形态,创新经营新模式。 2023.4 《2023 深圳宝安区上云上平台企 业补贴标准》 对上云上平台的企业,按照平台或 动修复;结合人工智能大模型,指导知识库和专家系统进行更多维 度分析预测,从而提高系统的稳定性和可靠性。 安全层面,云原生革新云上软件架构与应用模式,加速云安全向 云原生安全演进。云原生经过多年发展,已实现全行业高质量规模化 落地。云原生革新了传统用云方式,驱动传统应用充分享受云原生 化红利,也给传统安全防护体系带来了新的挑战。同时,云原生轻 量敏捷、高可靠、可编排的技术优势又为传统安全注入了新的活力,0 码力 | 47 页 | 1.22 MB | 1 年前3
第29 期| 2023 年9 月- 技术雷达长,如用户故事编写辅助、用户研究、电梯演讲和其他基于语言的任务。同时,我们希望开发人员能够负责任 地使用所有这些工具,并且始终掌控主导权,比如 hallucinated dependencies 就是其中一个需要注意的安全 和质量风险。 衡量生产力有多有效 对于非技术人员来说,软件开发有时似乎很神奇,这导致管理者需要努力衡量开发人员在完成其神秘任务时的 生产效率。我们的首席科学家 Martin Fowler 早在 2003 营。我们的团队使用如 Collibra 和 DataHub 的数据目录实现数据产品的可发现性,为了建立信任,我们发布数据质量和服务等级指标,比如数 据产品的及时性、完整性和一致性,并使用 Soda Core 和 Great Expectations 等工具自动化数据质量检查。 数 据可观测性可同时通过 Monte Carlo 等平台实现。 我们已经看到数据产品随着时间的推移,演变为多个用 示时,自然 语言会与结构化内容简单地交织在一起。与许多大语言模型行为一样,我们不知道为什么这样做有效,但我们 的经验表明,在人工编写的代码中加入自然语言注释也会改善基于大语言模型的编码助手的输出质量。 13. 追踪健康债务状况 试验 通过将健康度评级与其他服务级目标(SLO)同等对待,并据此确定增强的优先级,而不是仅仅关注跟踪技术 债务,我们不断体验到团队对其生态系统的改进。通过有效分0 码力 | 43 页 | 2.76 MB | 1 年前3
企业云原生的探索与落地深圳沙龙-RacherLabs-20-11-14/应用容器化最佳实践Labs. All Rights Reserved. Confidential 服务质量QoS QoS 是服务质量(Quality of Service)的缩写,为保证集群资源被有效调度分配的同时提高资源利用率,Kubernetes针 对不同服务质量的预期,通过 QoS 来对Pod进行服务质量管理。对于Pod而言,服务质量体现在两个具体的指标:CPU 和 内存,当节点上资源紧张时,Kubernetes0 码力 | 28 页 | 3.47 MB | 1 年前3
共 71 条
- 1
- 2
- 3
- 4
- 5
- 6
- 8













