分形树 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

机器学习课程-温州大学-07机器学习-决策树

1 2023年06月机器学习-决策树黄海广副教授 2 本章目录 01 决策树原理 02 ID3算法 03 C4.5算法 04 CART算法 3 1.决策树原理 01 决策树原理 02 ID3算法 03 C4.5算法 04 CART算法 4 长相能帅不帅家庭背景好能不好人品好上进心能不能有有无不能不好 1.决策树原理 ⚫ 决策树：从训练数据中学习得出一个树状结构的模型。 ⚫ 决策树属于判别模型。 ⚫ 决策树是一种树状结构，通过做出一系列决策（选择）来对数据进行划分，这类似于针对一系列问题进行选择。 ⚫ 决策树的决策过程就是从根节点开始，测试待分类项中对应的特征属性，并按照其值选择输出分支，直到叶子节点，将叶子节点的存放的类别作为决策结果。 node) 5 1.决策树原理根节点 (root node) 非叶子节点 (non-leaf node) (代表测试条件，对数据属性的测试) 分支 (branches) (代表测试结果) 叶节点 (leaf node) (代表分类后所获得的分类标记) ⚫ 决策树算法是一种归纳分类算法，它通过对训练集的学习，挖掘出有用的规则，用于对新数据进行预测。 ⚫ 决策树算法属于监督学习方法。

0 码力 | 39 页 | 1.84 MB | 1 年前
3
动手学深度学习 v2.0

结构的模型，通常用于自然语言处理和时间序列预测。在 10节中，我们介绍了一类新的模型，它采用了一种称为注意力机制的技术，最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将帮助读者快速了解大多数现代深度学习应用背后的基本工具。 • 第三部分讨论可伸缩性、效率和应用程序。首先，在 11节中，我们讨论了用于训练深度学习模型的几种常用优化算法。下一章 12节将探讨影响深度学习代码计算性能的几个关键因素。在再比如，如果用“过去的招聘决策数据”来训练一个筛选简历的模型，那么机器学习模型可能会无意中捕捉到历史残留的不公正，并将其自动化。然而，这一切都可能在不知情的情况下发生。因此，当数据不具有充分代表性，甚至包含了一些社会偏见时，模型就很有可能有偏见。 20 1. 引言 1.2.2 模型大多数机器学习会涉及到数据的转换。比如一个“摄取照片并预测笑脸”的系统。再比如通过摄取到的一组传分类可能变得比二项分类、多项分类复杂得多。例如，有一些分类任务的变体可以用于寻找层次结构，层次结构假定在许多类之间存在某种关系。因此，并不是所有的错误都是均等的。人们宁愿错误地分入一个相关的类别，也不愿错误地分入一个遥远的类别，这通常被称为层次分类(hierarchical classification)。早期的一个例子是卡尔·林奈13，他对动物进行了层次分类。在动物分类的应用中，

0 码力 | 797 页 | 29.45 MB | 1 年前
3
机器学习课程-温州大学-01机器学习-引言

|?)，非概率模型则为? = ?(?)。其中，?是输入，?是输出。在无监督学习中，概率模型可被表示为?(?|?)，非概率模型则为? = ?(?)。其中，?是输入，?是输出。 21 决策树、朴素贝叶斯、隐马尔科夫模型、高斯混合模型属于概率模型。感知机、支持向量机、KNN、AdaBoost、K-means以及神经网络均属于非概率模型。对于非概率模型而言，可按照判别函数线性与否分成线性模型与非线性模型。 (?2)?(?1|?2) ?(?1?2 ⋯ ??) = ?(?1)?(?2|?1)?(?3|?1?2) ⋯ ?(??|?1?2 ⋯ ??−1) 47 概率论与数理统计-常见分布 (1) 0-1分布:?(? = ?) = ??(1 − ?)1−?, ? = 0,1 (2) 二项分布:?(?, ?)： ?(? = ?) = ?????(1 − ?)?−?, ? = 0,1, ⋯ , ? (3) Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。 63 Python模块-Pandas ⚫ 基本数据结构 Series 一维数据结构，包含行索引和数据两个部分 DataFrame 二维数据结构，包含带索引的多列数据，

0 码力 | 78 页 | 3.69 MB | 1 年前
3
机器学习课程-温州大学-02-数学基础回顾-0.机器学习的数学基础整理（国内教材）

性相关 ⇔ |[?1, ?2, ⋯ , ??]| = 0 。 ② ? + 1个?维向量线性相关。 ③ 若?1, ?2 ⋯ ??线性无关，则添加分量后仍线性无关；或一组向量线性相关，去掉某些分量后仍线性相关。 3.有关向量组的线性表示 (1) ?1, ?2, ⋯ , ??线性相关⇔至少有一个向量可以用其余向量线性表示。 (2) ?1, ?2, ⋯ , ??线性无关，?1, ⋯ ⋯ ??1 ??2 ⋯ ???] ,这二次型?可改写成矩阵向量形式? = ????。其中?称为二次型矩阵，因为??? = ???(?, ? = 1,2,⋯ , ?)，所以二次型矩阵均为对称矩阵，且二次型与对称矩阵一一对应，并把矩阵?的秩称为二次型的秩。 2.惯性定理，二次型的标准形和规范形 (1) 惯性定理对于任一二次型，不论选取怎样的合同变换使它化为仅含平方项的标准型，其正负惯性指数与所选变换无关，这就是所谓的惯性定理。 (2) 标准形二次型? = (?1, ?2, ⋯ , ??) = ????经过合同变换? = ??化为? = ???? = ?????? ? = ∑ ???? 2 ? ?=1 称为 ?(? ≤ ?)的标准形。在一般的数域内，二次型的标准形不是唯一的，与所作的合同变换有关，但系数不为零的平方项的个数由?(?的秩)唯一确定。 (3) 规范形任一实二次型?都可经过合同变换化为规范形

0 码力 | 31 页 | 1.18 MB | 1 年前
3
机器学习课程-温州大学-08机器学习-集成学习

所有基模型的预测形成新的测试集，最后再对测试集进行预测。测试数据 7 Random Forest（随机森林）用随机的方式建立一个森林。随机森林算法由很多决策树组成，每一棵决策树之间没有关联。建立完森林后，当有新样本进入时，每棵决策树都会分别进行判断，然后基于投票法给出分类结果。优点 1. 在数据集上表现良好，相对于其他算法有较大的优势 2. 易于并行化，在大数据集上有很大的优势；体，它在以决策树为基学习器构建 Bagging 集成的基础上，进一步在决策树的训练过程中引入了随机特征选择，因此可以概括随机森林包括四个部分： 1. 随机选择样本（放回抽样）； 2. 随机选择特征； 3. 构建决策树； 4. 随机森林投票（平均）。随机森林训练数据 Bootstrap随机抽取决策树1 最终预测结果测试数据决策树n …… 决策树2 预测1 预测n 随机选择样本和 Bagging 相同，采用的是 Bootstraping 自助采样法；随机选择特征是指在每个节点在分裂过程中都是随机选择特征的（区别与每棵树随机选择一批特征）。这种随机性导致随机森林的偏差会有稍微的增加（相比于单棵不随机树），但是由于随机森林的“平均”特性，会使得它的方差减小，而且方差的减小补偿了偏差的增大，因此总体而言是更好的模型。随机森林数据集自助采样

0 码力 | 50 页 | 2.03 MB | 1 年前
3
经典算法与人工智能在外卖物流调度中的应用

XGBoost模型 - 采用近似求解算法，找出可能的分裂点，避免选用贪心算法的过高时间复杂度 - 计算采用不同分裂点时，叶子打分函数的增益；并选择增益最高的分裂点，作为新迭代树的最终分裂节点，构造新的迭代树 - 通过调节迭代树数目、学习倍率、迭代树最大深度、L2正则化参数等进一步避免过拟合 2 获取样本数据过滤数据抽取基础特征组合基础特征，构造组合特征组合基础特征，构造组合特征统计基础信息，构造统计特征重复（2）（3）直到找到相等子图的完备匹配供需平衡 13 5.1 配送时长预估模型 • 基于现有状况、订单增速、消化速度、天气、当前手段等多维特征，使用XGBoost模型回归预测未来五分钟进单的平均配送时长 • 分商圈、分时段、多模型的精细化预估 • 分布式、多线程、并行计算最佳分割点，满足海量数据的实时性要求 • 在供需失衡之前，即实施调控手段 5 供需平衡 14 5.2 单量调控模型训练维度分商圈分时段 Genetic Algorithm Gradient Descent 仿真系统离线训练在线学习优化模型加载数据仿真调度评估结果计算偏导求得梯度 24 智能调度系统对顾客等待时间的优化数据分析和技术是减少肥尾从而提高用户体验的最大贡献者，降低客户流失的可能性顾客等待时间订单的百分比平均等待时间显著缩短

0 码力 | 28 页 | 6.86 MB | 1 年前
3
超大规模深度学习在美团的应用-余建平

强  机器学习能力 = 数据 + 特征 + 模型 • 数据  海量数据：美团的亿级用户、千万级POI • 特征  大规模离散特征 > 小规模泛化特征 • 模型  DNN > 树模型 > LR 美团超大规模模型应用场景 • 可扩展的机器学习架构  基于Parameter Server架构  数据并行 —— 支持超大规模训练集  模型并行 —— 支持超大规模模型超大规模模型 -> 高扇出的分布式PS • 长尾效应：单个分片的抖动（网络、CPU）对请求影响变大  单分片4个9的可用性  16分片整体可用性：99.99% ^ 16 = 99.84%  64分片整体可用性：99.99% ^ 64 = 99.36%  128分片整体可用性：99.99% ^ 128 = 98.72% • Backup Request  Jeff Dean在解决BigTable高扇出时提出的方案粗排模型 • 精排模型排序模型解决方案 • 粗排阶段的特点  候选集大，通常在千到万级别  线上的响应时间要求高，通常在几到十几ms • 简单模型  计算耗时短：线性模型LR、树模型  模型表达能力不足，效果一般 • 复杂模型  DNN模型解决耗时是关键，利用预计算解决耗时问题  效果保障：保证用户的个性化信息，降低候选集计算复杂度粗排模型 • 精排阶段的特点

0 码力 | 41 页 | 5.96 MB | 1 年前
3
机器学习课程-温州大学-01深度学习-引言

传统翻译采用人工查词的方式，不但耗时长，而且错误率高。图像识别技术(OCR)的出现大大提升了翻译的效率和准确度，用户通过简单的拍照、截图或划线就能得到准确的翻译结果。体育赛事计算机视觉还有助于比赛和策略分析、球员表现和评级，以及跟踪体育节目中品牌赞助的可见性。农业半自动联合收割机可以利用人工智能和计算机视觉来分析粮食品质，并找出农业机械穿过作物的最佳路径。另外也可用来识别杂草和作物，有效减由于90％的医疗数据都是基于图像的，因此医学中的计算机视觉有很多用途。比如启用新的医疗诊断方法，分析X射线，乳房X光检查，监测患者等。 13 深度学习入门-目标检测目标检测结合了目标分类和定位两个任务。目标检测器的框架分为 one-stage(YOLO,YOLO9000,YOLOV3,YOLOV4, YOLOV5,SSD等) two-stage(OverFeat，R-CNN，Fast Language Processing）是一门通过建立形式化的计算模型来分析、理解和处理自然语言的学科，也是一门横跨语言学、计算机科学、数学等领域的交叉学科。自然语言处理，是指用计算机对自然语言的形、音、义等信息进行处理，即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识

0 码力 | 80 页 | 5.38 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

11.12 预训练的词向量 11.13 参考文献第 12 章自编码器 12.1 自编码器原理 12.2 MNIST 图片重建实战 12.3 自编码器变种 12.4 变分自编码器 12.5 VAE 实战 12.6 参考文献第 13 章生成对抗网络 13.1 博弈学习实例 13.2 GAN 原理 13.3 DCGAN 实战 13.4 片，对于多张图片来说，在前面添加一个数量维度(Dimension)，使用形状为[?, ℎ, ?]的张量来表示，其中?代表了批量大小(Batch Size)，这里?设置为 512；多张彩色图片可以使用形状为[?, ℎ, ?, ?]的张量来表示，其中?表示通道数量(Channel)，彩色图片? = 3。通过 PyTorch 提供的 torch.utils.data.DataLoader 类可以方便完成模型的批量训练，只需要调用设上，所有的运算操作(Operation，简称 OP)也都是基于张量对象进行的。复杂的神经网络算法本质上就是各种张量相乘、相加等基本运算操作的组合，在深入学习深度学习算法之前，熟练掌握 PyTorch 张量的基础操作方法十分重要。只有掌握了这些操作方法，才能随心所欲地实现各种复杂新奇的网络模型，也才能深刻理解各种模型算法的本质。 4.1 数据类型首先来介绍 PyTorch 中的基本数据类型，包含数值类型和布尔类型。虽然字符串类型

0 码力 | 439 页 | 29.91 MB | 1 年前
3
机器学习课程-温州大学-02深度学习-神经网络的编程基础

1 2023年03月深度学习-神经网络的编程基础黄海广副教授 2 本章目录 01 二分类与逻辑回归 02 梯度下降 03 计算图 04 向量化 3 1.二分类与逻辑回归 02 梯度下降 01 二分类与逻辑回归 03 计算图 04 向量化 4 符号定义 ?：表示一个??维数据，为输入数据，维度为(??, 1)；逻辑回归 Logistic Regression 经典的分类算法,简单、有效，目前用到最多的机器学习分类算法之一。 ? ? 代表一个常用的逻辑函数（logistic function）为?形函数（Sigmoid function）则：? ? = 1 1+?−? 合起来，我们得到逻辑回归模型的假设函数：当? ? 大于等于0.5时，预测 y=1 当? ? 小于0.5时，预测 y=0 ?? ⋅ ?? ?? = (− ? ? + (1−?) (1−?)) ⋅ ?(1 − ?) = ? − ? ?=??? + ? 9 2.梯度下降 02 梯度下降 01 二分类与逻辑回归 03 计算图 04 向量化 10 梯度下降 ? 学习率步长 11 梯度下降的三种形式批量梯度下降（Batch Gradient Descent,BGD）

0 码力 | 27 页 | 1.54 MB | 1 年前
3

共 55 条前往

页

分类

语言

格式