实数 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Greenplum 分布式数据库内核揭秘

PostgreSQL 的默认存储方式。支持高效的更新和删除操作，通常用于 OLTP 。 l Append-Optimized 表：以追加的方式写入数据，有着极高的写入性能，通常用于存储数据仓库中的事实数据，不适合做频繁的更新、删除操作。 l Append-Optimized, Column Oriented 表：即 AOCO 表，在 Append-Optimized 的基础之上按列进行存储，

0 码力 | 31 页 | 3.95 MB | 1 年前
3
Greenplum 新一代数据管理和数据分析解决方案

客户实例：福克斯互动媒体（Fox Interactive Media） • 业务问题 • 改进定位广告 • 竞争对手 • Teradata, Oracle • 数据规模 • 1万亿行事实数据表，每天增加 3TB • 硬件 • 40节点的Sun数据仓库设备 • 优势 • 可以通过控制支持快速膨胀的数据集 “Greenplum将成为我们不可或缺的合作伙伴，因为我们需要不断更新数据操作方式，使用户和广告商

0 码力 | 45 页 | 2.07 MB | 1 年前
3
Greenplum Database 管理员指南 6.2.1

能更有助于优化器选择更合理的执行计划。  使用真实数据进行测试。用测试数据进行测试，这的确可以测出哪些索引是有用的，但这样的结论对测试数据是没错的，但这个结论对于真实的数据可能没有任何帮助。  不要使用很少的数据来进行测试，因为跟真实的场景可能偏差太大。当测试的数据量很小时，特定的条件匹配到的记录数将会非常少，此时优化器很可能会选择使用索引扫描，而真实数据量很大，同样的条件可能匹配到的记录数会非常多，此时优数量级非常大的cost，可能执行计划的确是有问题的。有时，cost的值会严重失真，例如统计信息失真的情况下，这时的cost将变的不再真实。  rows -- 该算子输出的记录数。该值可能与真实数量有较大的出入，其会反映 WHERE子句的条件对记录的过滤。顶端算子评估的数量，在理想状态下与真实返回的、更新的或者删除的数据量接近。  width -- 该算子产生的每条记录的尺寸(字节数)。这里不一定能真实体现计算

0 码力 | 416 页 | 6.08 MB | 1 年前
3

共 3 条前往

页

Greenplum 分布布式分布式数据据库数据库内核揭秘一代新一代管理数据管理分析数据分析解决方案解决方案 Database 管理员指南

分类

语言

格式

Greenplum 分布式数据库内核揭秘

Greenplum 新一代数据管理和数据分析解决方案

Greenplum Database 管理员指南 6.2.1