Greenplum Database 管理员指南 6.2.1......................................................................................... - 142 - 设置序列为字段缺省值 .......................................................................................... ....................... - 277 - 确认 IO 参数和 Huge Page 设置 ....................................................................... - 277 - 确认 ssh 设置 ..................................................... ..................................................................................... - 387 - 共享内存设置 ..................................................................................................0 码力 | 416 页 | 6.08 MB | 1 年前3
 Greenplum数据仓库UDW - UCloud中立云计算服务商开发的⼤规模并⾏、完全托管的 PB 级数据仓库服务。 选择节点个数:UDW 是分布式架构、所有节点数据都是双机热备,实际可⽤总容量略⼩于节点个数*节点磁盘⼤⼩/2,请根据实际数据⼤⼩选择合适的节点。 3.设置数据仓库信息 必选项有数据仓库名称、DB管理员⽤⼾名、管理员密码。可选项有默认DB,默认DB的名称为dev,你可以选择除了“test”、“postgres”、“template”、“template0”、“template1” 退出 2. ⼀般选项 \c [数据库名]-[⽤⼾名] 连接到新数据库 \cd [⽬录名] 改变当前的⼯作⽬录 \encoding [编码] 显⽰或设置客⼾端编码 \h [名字] SQL命令的语法帮助 \set [名字 [值]] 设置内部变量 \timing 查询计时开关切换(默认关闭) \unset 名字 取消(删除)内部变量 3. 查询缓冲区选项 开发指南 Greenplum数据仓库 在⾮对⻬和对⻬的输出模式之间切换 \C [字串] 设置表标题, 如果参数空则取消标题 \f [字串] 为⾮对⻬查询输出显⽰或设置域分隔符 \H 在 HTML 输出模式之间切换 (当前是 关闭) \pset 变量 [值] 设置表的输出选项 \t 只显⽰⾏ (当前是 关闭) \T [字串] 设置 HTML <表> 标记属性, 如果没有参数就取消设置 \x 在扩展输出之间切换 (⽬前是 关闭)0 码力 | 206 页 | 5.35 MB | 1 年前3
 Pivotal Greenplum 最佳实践分享kernel.sem = 250 512000 100 2048  Redhat 6.2以后,内核增加了hugepage大页内存管理,关闭hugepage可以提高混合负载管理性能 设置办法:修改local脚本 For SUSE /etc/init.d/boot.local For RHLE /etc/rc.d/rc.local 追加内容: blockdev --setra Vacuum Full的处理性能非常低,一般情况下不建议采用,可以用Reorganize代替、或者使用AO表; 系统表不支持Reorganize操作,因此,需要定期vacuum,例如设置定时作业,每周对所有系统表vacuum analyze一次 • 查询视图GP_TOOLKIT.GP_BLOAT_DIAG可监控垃圾空间的膨胀系数 • REINDEX:回收索引的垃圾空间 引,或者采用分区交换降低对目标表的影响 临时空间的监控和管理  临时空间被无限制使用,可能导致系统空间撑爆,为了避免这种情况,建议设置以下参数 – gp_workfile_compress_algorithm zlib,设置该参数,所有的中间数据都被压缩,同时可减少IO消耗 – gp_workfile_limit_files_per_query0 码力 | 41 页 | 1.42 MB | 1 年前3
 Greenplum 精粹文集((source IP XOR dest IP) AND 0xffff) modulo)】,这 样能保证流量均匀的打在多块网卡上,另外注意采用 mode4 绑定的 时候,一定要把交换机设置在 802.3ad 模式下。 2. 主节点服务器 Greenplum 集群是有 master 架构,关于有、无 master 架构业界一直 有所争论。 从功能上而言 master 节点是对外服务的入口,用户所有的请求都必须 number 258, for 'gp_persistent_relation_ node' 该错误可能会导致实例启动失败,数据库实例恢复失败等情况。首 先可在问题的实例(postgresql.conf)中设置参数 gp_persistent_ skip_free_list=true。 让 出 问 题 的 实 例 先 启 动 起 来, 再 进 行 gpcheckcat 检查。 Big Date2.indd value 1131958 found in scan ('gp_persistent_relation_node') 该问题可能会导致实例启动失败。可在问题的实例(postgresql. conf)中设置参数 gp_persistent_repair_global_sequence=true, 便可修复相应问题,让相应实例正常启动。 3) 报错的实例日志中出现类似信息 Persistent 0 码力 | 64 页 | 2.73 MB | 1 年前3
 Greenplum备份恢复浅析每个segment备份时设置隔离级别为串行化,保证每个 segment的数据一致性 但是,各个segment的数据设置隔离级别的动作存在时间差, 而master仍然接受新的事务,从而导致各个segment上的数 据不一致。我们可以通过实现barrier机制来避免这种情况: 1. 使数据库只读 2. 等待所有的事务全部提交,开始备份 3. 给pg_class加锁,等待每个segment备份时设置隔离级别 为串行化,恢复数据库为可读可写0 码力 | 17 页 | 1.29 MB | 1 年前3
 PostgreSQL和Greenplum 数据库故障排查和DROP 语句。mod记录所有ddl 语句,加上数据修改语句INSERT,UPDATE等,all记录所有执行的 语句,将此配置设置为all可跟踪整个数据库执行的SQL语句。 log_duration = off 记录每条SQL语句执行完成消耗的时间,将此配置设置为on, 用于统计哪些SQL语句耗时较长。 记录校验点的信息 log_checkpoints = on log_connections0 码力 | 84 页 | 12.61 MB | 1 年前3
 Greenplum 编译安装和调试验证,发现已经安装了。 而使用 ssh 验证发现使用了不同路径的 python。 2.2.8 小技巧 Greenplum使用 Bash 和 Python 脚本初始化集群和管理集群。可以通过在合适的地方设置日志或 者调试信息可以帮助分析某些难以解决的问题。 ● 集群初始化工具 gpinitsystem 是Bash脚本工具,有些时候它的报错信息很不清楚。这个 时候可以 ○ 使用 -D 选项 ○ to process 38965” 的消息,则表示进程 attach成功,可以使用 clion进行调试了。 通过图像化窗口定位到 “ExecProcNode” 函数,通过单击下图的小红圈处,即可设置断点在 ExecAgg() 调用处。 执行 SELECT count(*) FROM students 语句,可以使用各种调试命令(例如单步执行、断点、跳 出函数等)方便的调试代码。0 码力 | 15 页 | 2.07 MB | 1 年前3
 Greenplum资源管理器manager 2017 年象行中国(杭州 站)第一期 Resource Group • CGroups控制CPU – 目录:cpu/gpdb/rg1/, cpu/gpdb/rg2/ … – 设置cpu/gpdb/cpu.cfs_quota_us – cpu/gpdb/cpu.shares足够大 – rg1和rg2的cpu.shares按比例配置 – 空闲group配额会被抢占 – 精确控制0 码力 | 21 页 | 756.29 KB | 1 年前3
 Greenplum 排序算法顺串数减1,输出缓冲区顺串数加1。 ● 3. 如果任何一个输入缓冲区的顺串数都大于0,重复第2步。 ● 4. 如果所有缓冲区的顺串数和大于1,选取顺串数为0的输入缓冲区作为新的输 出缓冲区,将原输出缓冲区设置为新的输入缓冲区,重复第2步。 ● 5. 如果所有缓冲区的顺串数和为1,则该顺串就是排好序的元组,算法结束。 多相归并排序 34 ● 同样以4个文件为假设,多相归并排序使用3个文件作为输入文件,1个文件作为0 码力 | 52 页 | 2.05 MB | 1 年前3
共 9 条
- 1
 













