二叉搜索树 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

机器学习课程-温州大学-07机器学习-决策树

1 2023年06月机器学习-决策树黄海广副教授 2 本章目录 01 决策树原理 02 ID3算法 03 C4.5算法 04 CART算法 3 1.决策树原理 01 决策树原理 02 ID3算法 03 C4.5算法 04 CART算法 4 长相能帅不帅家庭背景好能不好人品好上进心能不能有有无不能不好 1.决策树原理 ⚫ 决策树：从训练数据中学习得出一个树状结构的模型。 ⚫ 决策树属于判别模型。 ⚫ 决策树是一种树状结构，通过做出一系列决策（选择）来对数据进行划分，这类似于针对一系列问题进行选择。 ⚫ 决策树的决策过程就是从根节点开始，测试待分类项中对应的特征属性，并按照其值选择输出分支，直到叶子节点，将叶子节点的存放的类别作为决策结果。 node) 5 1.决策树原理根节点 (root node) 非叶子节点 (non-leaf node) (代表测试条件，对数据属性的测试) 分支 (branches) (代表测试结果) 叶节点 (leaf node) (代表分类后所获得的分类标记) ⚫ 决策树算法是一种归纳分类算法，它通过对训练集的学习，挖掘出有用的规则，用于对新数据进行预测。 ⚫ 决策树算法属于监督学习方法。

0 码力 | 39 页 | 1.84 MB | 1 年前
3
Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf

�� 目录 1、视频搜索的挑战 %、深度学m在视频内容理解h的应用——召回 3、深度学m在语k搜索h的应用——语k表征 4、深度学m在排序h的应用——g性化表征视频搜索的挑战 1��/��——�� 2��/��——�� 3��——�� 1��

0 码力 | 24 页 | 9.60 MB | 1 年前
3
深度学习在百度搜索中的工程实践-百度-曹皓

0 码力 | 40 页 | 29.46 MB | 1 年前
3
动手学深度学习 v2.0

. . . . . . . . . . . . . . . . . 375 9.8 束搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 9.8.1 贪心搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 9.8.2 穷举搜索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378 9.8.3 束搜索 . . . . . . . . . . . . . . . . . . . . . . . . . ng）的。就像在现实生活中，尽管模拟考试考得很好，真正的考试不一定百发百中。 1.2.4 优化算法当我们获得了一些数据源及其表示、一个模型和一个合适的损失函数，接下来就需要一种算法，它能够搜索出最佳参数，以最小化损失函数。深度学习中，大多流行的优化算法通常基于一种基本方法–梯度下降（gradient descent）。简而言之，在每个步骤中，梯度下降法都会检查每个参数，看看如果仅对该参数进行少量变动，训

0 码力 | 797 页 | 29.45 MB | 1 年前
3
机器学习课程-温州大学-06机器学习-KNN算法

2021年04月机器学习-KNN算法黄海广副教授 2 01 距离度量 02 KNN算法本章目录 03 KD树划分 04 KD树搜索 3 01 距离度量 02 KNN算法 03 KD树划分 04 KD树搜索 1.距离度量 4 距离度量欧氏距离(Euclidean distance) ? ?, ? = ෍ ? ?? − ∥ = σ?=1 ? ?? × ?? σ?=1 ? ( ??)2 × σ?=1 ? ( ??)2 10 01 距离度量 02 KNN算法 03 KD树划分 04 KD树搜索 2.KNN算法 11 2.KNN算法 ?近邻法（k-Nearest Neighbor,kNN）是一种比较成熟也是最简单的机器学习算法，可以用于基本的分类与回归方法。算法的主要思路： 01 距离度量 02 KNN算法 03 KD树划分 04 KD树搜索 3.K-D-Tree划分 15 KD树划分 KD树(K-Dimension Tree)，，也可称之为K维树，可以用更高的效率来对空间进行划分，并且其结构非常适合寻找最近邻居和碰撞检测。假设有 6 个二维数据点，构建KD树的过程： ? = (2,3), (5,7), (9,6), (4

0 码力 | 26 页 | 1.60 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

自我介绍 2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习工程相关的工作，加入美团后，负责超大规模机器学习系统，从无到有搭建起支持千亿级别规模的深度学习系统，与推荐、搜索、广告业务深度合作，在算法上提供从召回到排序的全系统优化方案，在工程上提供离线、近线、在线的全流程解决方案。目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标 • 美团超大规模模型场景简介 • 超大规模机器学习MLX  MLX平台目标  MLX平台架构 • 模型场景应用  召回模型  排序模型美团超大规模模型应用场景美团推荐美团搜索美团广告美团应用场景简介 • 场景特点 亿级的用户，千万级的O2O商品 海量的用户行为，完整的交易闭环 LBS相关的推荐 • 模型特点 百亿级别的训练数据 千亿级别的模型特征强  机器学习能力 = 数据 + 特征 + 模型 • 数据  海量数据：美团的亿级用户、千万级POI • 特征  大规模离散特征 > 小规模泛化特征 • 模型  DNN > 树模型 > LR 美团超大规模模型应用场景 • 可扩展的机器学习架构  基于Parameter Server架构  数据并行 —— 支持超大规模训练集  模型并行 —— 支持超大规模模型

0 码力 | 41 页 | 5.96 MB | 1 年前
3
机器学习课程-温州大学-Scikit-learn

predict(X_test) LASSO linear_model.Lasso Ridge linear_model.Ridge ElasticNet linear_model.ElasticNet 回归树 tree.DecisionTreeRegressor 15 2.Scikit-learn主要用法监督学习算法-分类 from sklearn.tree import DecisionTreeClassifier clf.fit(X_train, y_train) y_pred = clf.predict(X_test) y_prob = clf.predict_proba(X_test) 使用决策树分类算法解决二分类问题， y_prob 为每个样本预测为 “0”和“1”类的概率 16 1.Scikit-learn概述逻辑回归支持向量机朴素贝叶斯 K近邻 linear_model.LogisticRegression scoring=’f1_weighted’) 使用5折交叉验证对决策树模型进行评估，使用的评分函数为F1值 sklearn提供了部分带交叉验证功能的模型类如LassoCV、LogisticRegressionCV等，这些类包含cv参数 26 2.Scikit-learn主要用法交叉验证及超参数调优超参数调优⸺网格搜索 from sklearn.model_selection import

0 码力 | 31 页 | 1.18 MB | 1 年前
3
机器学习课程-温州大学-12机器学习-关联规则

缩到一棵频繁模式树（FP-Tree），但仍保留项集关联信息。该算法是对Apriori方法的改进。生成一个频繁模式而不需要生成候选模式。 FP-growth算法以树的形式表示数据库，称为频繁模式树或FP-tree。此树结构将保持项集之间的关联。数据库使用一个频繁项进行分段。这个片段被称为“模式片段”。分析了这些碎片模式的项集。因此，该方法相对减少了频繁项集的搜索。 27 3 算法发现频繁项集的过程是： (1)构建FP树； (2)从FP树中挖掘频繁项集。 28 3.FP-Growth算法 FP-growth算法思想该算法和Apriori算法最大的不同有两点：第一，不产生候选集第二，只需要两次遍历数据库，大大提高了效率。 29 3.FP-Growth算法 FP-Tree （ Frequent Pattern Tree ） FP树(FP-Tree)是由数据库的初始项集组成的树状结构。 FP树(FP-Tree)是由数据库的初始项集组成的树状结构。 FP树的目的是挖掘最频繁的模式。FP树的每个节点表示项集的一个项。根节点表示null，而较低的节点表示项集。在形成树的同时，保持节点与较低节点（即项集与其他项集）的关联。 30 3.FP-Growth算法算法步骤 FP-growth算法的流程为：首先构造FP树，然后利用它来挖掘频繁项集。在构造FP树时，需要对数据集扫描两遍，第一遍扫描用来统计频率，第二遍扫描至考虑频繁项集。

0 码力 | 49 页 | 1.41 MB | 1 年前
3
经典算法与人工智能在外卖物流调度中的应用

XGBoost模型 - 采用近似求解算法，找出可能的分裂点，避免选用贪心算法的过高时间复杂度 - 计算采用不同分裂点时，叶子打分函数的增益；并选择增益最高的分裂点，作为新迭代树的最终分裂节点，构造新的迭代树 - 通过调节迭代树数目、学习倍率、迭代树最大深度、L2正则化参数等进一步避免过拟合 2 获取样本数据过滤数据抽取基础特征组合基础特征，构造组合特征组合基础特征，构造组合特征统计基础信息，构造统计特征提纲 23 外卖订单的智能调度系统一. 智能调度系统的大数据分析监控二. 智能调度系统中的人工智能三. 智能调度系统的自主学习能力预分配在线预估实时评价基础设施搜索方式 Grid Search 训练维度分商圈分时段 Genetic Algorithm Gradient Descent 仿真系统离线训练在线学习优化模型加载数据

0 码力 | 28 页 | 6.86 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

个性化推荐视频理解智能对话系统图像检索更多场景  OCR识别  人脸核身  智能风控  自动驾驶  语音助手 • • • 优势: 效果显著超越传统模型(线性层模型 / 树模型 / SVM模型 / … ) 深度学习应用场景沙漠湖泊旅行深度学习应用主要的挑战： 2.模型效果优化困难 3.工程优化复杂 4.数据获取困难挑战深度模型是非线性的: 标准化  标准化模型库  标准化解决方案 1.方案复杂图像搜索推荐语音视频理解 NLP 广告 CNN RNN GNN MLP Tensorflow PyTorch Parameter Server MPI TreeModel SQL MapReduce Blink  场景丰富: 图像/视频/推荐/搜索  大数据+大模型: Model Zoo  跨场景+跨模态 mmoe, ple?  特征选择/生成: Age, sex, comment, click… 解决方案: 超参搜索效果提升模型理解问题: 黑盒 1. 参数太多 / 参数敏感 2. 候选空间大 3. 场景数据相关模型创新 2.模型效果优化模型效果优化: 超参数搜索NNI ExpId f1 .dim f2.dim auc 1 2 80 80 0 .687 9 48 48

0 码力 | 40 页 | 8.51 MB | 1 年前
3

共 34 条前往

页

分类

语言

格式

机器学习课程-温州大学-07机器学习-决策树

Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf

深度学习在百度搜索中的工程实践-百度-曹皓

动手学深度学习 v2.0

机器学习课程-温州大学-06机器学习-KNN算法

超大规模深度学习在美团的应用-余建平

机器学习课程-温州大学-Scikit-learn

机器学习课程-温州大学-12机器学习-关联规则

经典算法与人工智能在外卖物流调度中的应用

阿里云上深度学习建模实践-程孟力