 Greenplum 分布式数据库内核揭秘PostgreSQL 的默认存储方式。支持高效的更新 和删除操作,通常用于 OLTP 。 l Append-Optimized 表:以追加的方式写入数据,有着极高的写入性能,通常用于存储数据仓 库中的事实数据,不适合做频繁的更新、删除操作。 l Append-Optimized, Column Oriented 表:即 AOCO 表,在 Append-Optimized 的基础之 上按列进行存储,0 码力 | 31 页 | 3.95 MB | 1 年前3 Greenplum 分布式数据库内核揭秘PostgreSQL 的默认存储方式。支持高效的更新 和删除操作,通常用于 OLTP 。 l Append-Optimized 表:以追加的方式写入数据,有着极高的写入性能,通常用于存储数据仓 库中的事实数据,不适合做频繁的更新、删除操作。 l Append-Optimized, Column Oriented 表:即 AOCO 表,在 Append-Optimized 的基础之 上按列进行存储,0 码力 | 31 页 | 3.95 MB | 1 年前3
 Greenplum 新一代数据管理和数据分析解决方案客户实例:福克斯互动媒体 (Fox Interactive Media) • 业务问题 • 改进定位广告 • 竞争对手 • Teradata, Oracle • 数据规模 • 1万亿行事实数据表,每天增加 3TB • 硬件 • 40节点的Sun数据仓库设备 • 优势 • 可以通过控制支持快速膨胀的数据集 “Greenplum将成为我们不可或缺的合作伙伴,因为我们需要不断更新数据操作方式,使用户和广告商0 码力 | 45 页 | 2.07 MB | 1 年前3 Greenplum 新一代数据管理和数据分析解决方案客户实例:福克斯互动媒体 (Fox Interactive Media) • 业务问题 • 改进定位广告 • 竞争对手 • Teradata, Oracle • 数据规模 • 1万亿行事实数据表,每天增加 3TB • 硬件 • 40节点的Sun数据仓库设备 • 优势 • 可以通过控制支持快速膨胀的数据集 “Greenplum将成为我们不可或缺的合作伙伴,因为我们需要不断更新数据操作方式,使用户和广告商0 码力 | 45 页 | 2.07 MB | 1 年前3
 Greenplum Database 管理员指南 6.2.1能更有助于优化器选择更合理的执行计划。  使用真实数据进行测试。用测试数据进行测试,这的确可以测出哪些索引是有用的, 但这样的结论对测试数据是没错的,但这个结论对于真实的数据可能没有任何帮助。  不要使用很少的数据来进行测试,因为跟真实的场景可能偏差太大。当测试的数据 量很小时,特定的条件匹配到的记录数将会非常少,此时优化器很可能会选择使用 索引扫描,而真实数据量很大,同样的条件可能匹配到的记录数会非常多,此时优 数量级非常大的cost,可能执行计划的确是有问题的。有时,cost的值会严重失真, 例如统计信息失真的情况下,这时的cost将变的不再真实。  rows -- 该算子输出的记录数。该值可能与真实数量有较大的出入,其会反映 WHERE子句的条件对记录的过滤。顶端算子评估的数量,在理想状态下与真实返回的、 更新的或者删除的数据量接近。  width -- 该算子产生的每条记录的尺寸(字节数)。这里不一定能真实体现计算0 码力 | 416 页 | 6.08 MB | 1 年前3 Greenplum Database 管理员指南 6.2.1能更有助于优化器选择更合理的执行计划。  使用真实数据进行测试。用测试数据进行测试,这的确可以测出哪些索引是有用的, 但这样的结论对测试数据是没错的,但这个结论对于真实的数据可能没有任何帮助。  不要使用很少的数据来进行测试,因为跟真实的场景可能偏差太大。当测试的数据 量很小时,特定的条件匹配到的记录数将会非常少,此时优化器很可能会选择使用 索引扫描,而真实数据量很大,同样的条件可能匹配到的记录数会非常多,此时优 数量级非常大的cost,可能执行计划的确是有问题的。有时,cost的值会严重失真, 例如统计信息失真的情况下,这时的cost将变的不再真实。  rows -- 该算子输出的记录数。该值可能与真实数量有较大的出入,其会反映 WHERE子句的条件对记录的过滤。顶端算子评估的数量,在理想状态下与真实返回的、 更新的或者删除的数据量接近。  width -- 该算子产生的每条记录的尺寸(字节数)。这里不一定能真实体现计算0 码力 | 416 页 | 6.08 MB | 1 年前3
共 3 条
- 1













