Greenplum分布式事务和两阶段提交协议并发控制 索引/文件/ 记录管理器 缓冲区管理器 缓冲区 锁表 存储管理器 存储 查询计划 对索引、文件和 记录的请求 页命令 事务命令 查询、更新 用户/ 应用 DDL命令 数据库管理员 数据、元数据、索引 日志页 读、写页 元数据、 统计数据 元数据 9 存储介质的类型 ■ Volatile storage 易失性存储器 DRAM, Cache, Register 允许Buffer Pool里未提交事务所修改的脏页刷回到持久存储 No-steal: 不允许Buffer Pool里未提交事务所修改的脏页刷到持久存储中 缓冲区管理策略Buffer Management Policy 13 ■ Force策略的问题 对持久存储器进行频繁的随机写操作,性能下降。 ■ No-Steal策略的问题 不允许未提交事务的脏页换出,系统的并发量不高。 ▪ No-Force 有更好的性能,但是怎么保证事务的原子性和持久 性? ❏ No-Force: 事务提交,所修改的数据页没有刷回至持久存储,如果发生断电 或者系统崩溃。 ❏ Steal: Buffer Pool中未提交的事务所修改的脏页刷回到持久存储,如果发生 断电或者系统崩溃。 缓冲区管理策略 14 ■ No-Force → Redo Log 事务提交时,数据页不需要刷回持久存储,为了保证持久性,先把Redo Log写 入日志文件。Redo0 码力 | 42 页 | 2.12 MB | 1 年前3
Greenplum机器学习⼯具集和案例模和预测 ● 实现流程全⾃自动化 背景 2017.thegiac.com 数据源 • 客户数据 - 购买 - 预定 - 营销 - 在线注册 - ⽹网⻚页浏览历史 - 地理理信息数据 - 业务部⻔门信息 - ⽹网站⽤用户信息 • TB 级别数据 • 1000+ 特征 平台 建模⼯工具 PL/pgSQL 数据和技术预览0 码力 | 58 页 | 1.97 MB | 1 年前3
Pivotal Greenplum 最佳实践分享 kernel.shmmax = 1000000000 kernel.sem = 250 512000 100 2048 Redhat 6.2以后,内核增加了hugepage大页内存管理,关闭hugepage可以提高混合负载管理性能 设置办法:修改local脚本 For SUSE /etc/init.d/boot.local For RHLE /etc/rc0 码力 | 41 页 | 1.42 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1MIN之间可 能也测不出差异,无法达到资源组的CPU压制效果,如果能达到,也就不需要资源 组了。 活动语句的成本限制。该值限制的是,由执行计划评估得到的的Cost值,该值以 涉及的磁盘页(disk page)作为计量单位。 资源队列创建好之后,ROLE(User)可以被分配到合适的资源队列。一个资源队列 可以分配多个ROLE,但每个ROLE只能被分配到一个资源队列。 资源队列如何工作 Cost是查询优化器(如使用EXPLAIN查看)评估出来的总预估成本。因此管理员在 设置时需要对该系统执行的查询很熟悉才可以得到一个恰当的Cost阈值。Cost意味着 对磁盘的操作数量。1.0等于获取一个磁盘页(disk page)。 例如,创建一个Cost阈值为100000.0 (1e+5),名称为webuser的资源队列: =# CREATE RESOURCE QUEUE webuser 生记录在Instance之间移动。 EXPLAIN的输出中每个算子都有一行,其显示基本的算子类型和该算子的成本估算: cost -- 访问的磁盘页数量,就是说,1.0等于一个连续的磁盘页操作。第一个 值是获得第一条记录的成本,第二个值是获得所有记录的总成本。总成本是假设会检索 所有的记录,但有时并不会真的检索所有记录,比如使用了LIMITX子句,可能不会真 的检索所有记录。例如:0 码力 | 416 页 | 6.08 MB | 1 年前3
共 4 条
- 1













