Greenplum数据库 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

机器学习课程-温州大学-12机器学习-关联规则

0年提出的关联分析算法，它采取如下分治策略：将提供频繁项集的数据库压缩到一棵频繁模式树（FP-Tree），但仍保留项集关联信息。该算法是对Apriori方法的改进。生成一个频繁模式而不需要生成候选模式。 FP-growth算法以树的形式表示数据库，称为频繁模式树或FP-tree。此树结构将保持项集之间的关联。数据库使用一个频繁项进行分段。这个片段被称为“模式片段”。分析了这些 FP-growth算法只需要对数据库进行两次扫描，而Apriori算法在求每个潜在的频繁项集时都需要扫描一次数据集，所以说Apriori算法是高效的。其中算法发现频繁项集的过程是： (1)构建FP树； (2)从FP树中挖掘频繁项集。 28 3.FP-Growth算法 FP-growth算法思想该算法和Apriori算法最大的不同有两点：第一，不产生候选集第二，只需要两次遍历数据库，大大提高了效率。第二，只需要两次遍历数据库，大大提高了效率。 29 3.FP-Growth算法 FP-Tree （ Frequent Pattern Tree ） FP树(FP-Tree)是由数据库的初始项集组成的树状结构。 FP树的目的是挖掘最频繁的模式。FP树的每个节点表示项集的一个项。根节点表示null，而较低的节点表示项集。在形成树的同时，保持节点与较低节点（即项集与其他项集）的关联。 30 3.FP-Growth算法

0 码力 | 49 页 | 1.41 MB | 1 年前
3
机器学习课程-温州大学-10深度学习-人脸识别与风格迁移

verification）人脸识别（face recognition） • 有一个K个人的人脸数据库 • 获取输入图像 • 如果图像是K个人中的某人（或不认识） • 输入图片，以及某人的ID或者是名字 • 验证输入图片是否是这个人人脸聚类（Face Clustering）在数据库中对人脸进行聚类，直接K-Means即可。 5 1.人脸识别概述人脸检测的步骤 • 人脸定位在一次学习问题中，只能通过一个样本进行学习，以能够认出同一个人。大多数人脸识别系统都需要解决这个问题。系统需要做的就是，仅仅通过一张已有的照片，来识别前面这个人确实是她。相反，如果机器看到一个不在数据库里的人所示），机器应该能分辨出她不是数据库中四个人之一。 ?(???1, ???2) = ?????? ?? ?????????? ??????? ?????? 只要你能学习这个函数?，通过输入一对图片，它将会告诉

0 码力 | 34 页 | 2.49 MB | 1 年前
3
《TensorFlow 2项目进阶实战》6-业务落地篇：实现货架洞察Web应⽤

效果理论：使用 OpenCV 可视化识别结果 • 展现 AI 效果实战：使用 OpenCV 可视化识别结果 • 搭建 AI SaaS 理论：Web 框架选型 • 搭建 AI SaaS 理论：数据库 ORM 选型 • 搭建 AI SaaS 理论：10 分钟快速开发 AI SaaS • 搭建 AI SaaS 实战：10 分钟快速开发 AI SaaS • 交付 AI SaaS：10 分钟快速掌握容器部署 Web 框架 - Flask Python Web 框架 - Flask Flask 常用扩展 Flask 项目常见目录结构启动文件 manage.py 示例搭建 AI SaaS 理论：数据库 ORM 选型 ORM 是什么 ORM 是什么常见的 Python ORM • SQLAlchemy • Flask-SQLAlchemy • Django ORM • peewee

0 码力 | 54 页 | 6.30 MB | 1 年前
3
亚马逊AWSAI Services Overview

2017 Amazon 的人工智能&深度学习围绕数据的“飞轮” 机器学习深度学习人工智能更多的用户更好的产品更多的数据更好的分析对象存储数据库数据仓库数据流分析商业智能 Map/Reduce 内存数据库数据检索点击流用户活动内容生成购买点击喜好传感器数据机器学习& 人工智能大数据更多的用户更好的产品更多的数据更好的分析围绕数据的“飞轮”

0 码力 | 56 页 | 4.97 MB | 1 年前
3
机器学习课程-温州大学-01机器学习-引言

⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供免费的社区版与付费的专业版。专业版额外增加了一些功能，如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版已足够。如果有edu邮箱，那么推荐使用专业版，edu邮箱是可以免费使用专业版的。安装过程照着提示一步步操作就可以了。注意：安装路径尽量不使用带有 read_clipboard() | 从剪切板读取将DataFrame写入⽂件 df.to_csv() | 写入CSV文件 df.to_excel() | 写入Excel文件 df.to_sql() | 写入SQL表或数据库 df.to_json() | 写入JSON格式的文件 df.to_clipboard() | 写入剪切板 68 Python模块-SciPy ⚫SciPy SciPy是构建在NumPy的基础之上的，它

0 码力 | 78 页 | 3.69 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

我们有一个窗口（比如说三个单词），我们会对所有文本进行滑动。 3.滑动窗口为我们的模型生成训练样本 16 3.Word2Vec （下图左边为CBOW，右边为Skip-Gram） CBOW对小型数据库比较合适，而Skip-Gram在大型语料中表现更好。 17 3.Word2Vec 我们实际构建和训练模型的数据集将如下所示：这被称为连续词袋结构，并在word2vec论文 one of the ，和抽取式文本摘要(EATS)，即直接抽取原始素材并拼接成简单概要摘要/标题生成内容续写（例如文章续写）整段文本生成产品特色通过随机Mask(即遮挡)数据库文本中的词语或语段，让神经网络自主学习复原被遮挡部分，从而拥有“猜测”缺失内容的能力，产出预训练模型。再通过大规模预训练模型理解上文或给定条件，从概率层面推测最符合要求的输出结果。其本质是

0 码力 | 44 页 | 2.36 MB | 1 年前
3
机器学习课程-温州大学-01深度学习-引言

⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供免费的社区版与付费的专业版。专业版额外增加了一些功能，如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版已足够。如果有edu邮箱，那么推荐使用专业版，edu邮箱是可以免费使用专业版的。安装过程照着提示一步步操作就可以了。注意：安装路径尽量不使用带有 read_clipboard() | 从剪切板读取将DataFrame写入⽂件 df.to_csv() | 写入CSV文件 df.to_excel() | 写入Excel文件 df.to_sql() | 写入SQL表或数据库 df.to_json() | 写入JSON格式的文件 df.to_clipboard() | 写入剪切板 69 Python模块-SciPy ⚫SciPy SciPy是构建在NumPy的基础之上的，它

0 码力 | 80 页 | 5.38 MB | 1 年前
3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒

l云原生Cloud-Native超大规模视图存储、处理、检索 l处理数万到数十万路，城市范围级别监控、门禁摄像头数据 l10-100 Billion级别深度学习特征检索 - PB以上级别数据库存储 - 100PB级别抓拍图片存储 - 每秒万次并发检索请求 l大规模推广应用 l某种程度上说，城市内所有市民都是系统的用户深度学习算法发展为平台系统赋能首次超过人眼 2014 2015

0 码力 | 23 页 | 9.26 MB | 1 年前
3
机器学习课程-温州大学-机器学习项目流程

整 • 在测试集上评估最佳模型 • 解释模型结果 • 得出结论 • 数据清理和格式化 • 探索性数据分析(EDA) • 特征工程 • 特征选择 • 网络下载 • 网络爬虫 • 数据库读取 • 开放数据 • …… 7 2.数据清洗 01 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 8 2.数据清洗什么是数据清洗？

0 码力 | 26 页 | 1.53 MB | 1 年前
3
《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测

Python 用户的高性能和易于上手的数据结构化和数据分析工具。数据框（Data Frame）是一个二维带标记的数据结构，每列（column）数据类型可以不同。我们可以将其当作电子表格或数据库表。数据读入 pandas.read_csv 方法实现了快速读取 CSV（comma-separated) 文件到数据框的功能。数据可视化库：matplotlib & seaborn & mplot3d

0 码力 | 46 页 | 5.71 MB | 1 年前
3

共 15 条前往

页

分类

语言

格式