 Greenplum Database 管理员指南 6.2.1..................................................................................... - 24 - 角色与权限安全的最佳实践 ............................................................................................ - 子句中使用数据修改命令 ........................................................................... - 221 - 使用函数和运算符 ................................................................................................... .................................................................................. - 225 - 内置函数和运算符 .................................................................................................. -0 码力 | 416 页 | 6.08 MB | 1 年前3 Greenplum Database 管理员指南 6.2.1..................................................................................... - 24 - 角色与权限安全的最佳实践 ............................................................................................ - 子句中使用数据修改命令 ........................................................................... - 221 - 使用函数和运算符 ................................................................................................... .................................................................................. - 225 - 内置函数和运算符 .................................................................................................. -0 码力 | 416 页 | 6.08 MB | 1 年前3
 Greenplum 精粹文集请参考数学知识进行拆解。 Big Date2.indd 48 16-11-22 下午3:38 Greenplum 精粹文集 49 4. 关于函数 首先,Greenplum 更喜欢动态 SQL,就是没有占位符的那种,因为所 有的变量都可以在编译时完全获取,尤其是分区条件,相信已经有大 批开发人员在 function 中深受此问题困扰多年。 其次,你也许和我一样,更喜欢在 function 中能够直接将变量写进 近几年,数据外泄的问题甚为 猖獗,针对这一现象和相关的 监管要求,很多公司都在努力 提高数据安全性并对静态数 据启用加密功能,这同样也 适用于大数据,包括 Pivotal Greenplum 的用户。 Protegrity 是 Pivotal Greenplum 中的一个强大的替代性默认加密功能, 可提供功能数据加密,更好地保障用户安全。在本文中,我们将解释 与 Protegrity 的解决方案相比传统 Greenplum Greenplum 加密功能的工作方式, 展示 Greenplum 上的 Protegrity 设置,告诉读者如何加密静态数据并 提供 SQL 代码的示例以调用 Protegrity 的加密功能。 1. 默认的 Greenplum 加密和 Protegrity 的功能数据加密 2015 年,Pivotal 发 布 了 一 份 关 于 加 密 Greenplum 数 据 库 中 数 据 的 基0 码力 | 64 页 | 2.73 MB | 1 年前3 Greenplum 精粹文集请参考数学知识进行拆解。 Big Date2.indd 48 16-11-22 下午3:38 Greenplum 精粹文集 49 4. 关于函数 首先,Greenplum 更喜欢动态 SQL,就是没有占位符的那种,因为所 有的变量都可以在编译时完全获取,尤其是分区条件,相信已经有大 批开发人员在 function 中深受此问题困扰多年。 其次,你也许和我一样,更喜欢在 function 中能够直接将变量写进 近几年,数据外泄的问题甚为 猖獗,针对这一现象和相关的 监管要求,很多公司都在努力 提高数据安全性并对静态数 据启用加密功能,这同样也 适用于大数据,包括 Pivotal Greenplum 的用户。 Protegrity 是 Pivotal Greenplum 中的一个强大的替代性默认加密功能, 可提供功能数据加密,更好地保障用户安全。在本文中,我们将解释 与 Protegrity 的解决方案相比传统 Greenplum Greenplum 加密功能的工作方式, 展示 Greenplum 上的 Protegrity 设置,告诉读者如何加密静态数据并 提供 SQL 代码的示例以调用 Protegrity 的加密功能。 1. 默认的 Greenplum 加密和 Protegrity 的功能数据加密 2015 年,Pivotal 发 布 了 一 份 关 于 加 密 Greenplum 数 据 库 中 数 据 的 基0 码力 | 64 页 | 2.73 MB | 1 年前3
 Greenplum数据仓库UDW - UCloud中立云计算服务商{ name: 'brown', height: 68 } 2 图形界⾯的⽅式访问 图形界⾯的⽅式访问UDW 2.1 配置 配置UDW外⽹访问 外⽹访问 udw默认是通过内⽹访问的,为了数据安全性,尽量不要通过外⽹访问UDW,如果需要图形界⾯的⽅式访问UDW,则需要配置udw的外⽹访问,请参考: 前提:有⼀台可以访问 udw 的 uhost,并且这台 uhost 上可以访问外⽹ ip。 p_store_sales (date); 7、序列 、序列 通过使⽤序列,系统可以在新的纪录插⼊表中时,⾃动地按照⾃增⽅式分配⼀个唯⼀ID。使⽤序列⼀般就是为插⼊表中的纪录⾃动分配⼀个唯⼀标识符。您可以通过声明⼀个 SERIAL 类型 的标识符列,该类型将会⾃动创建⼀个序列来分配 ID。 创建序列 CREATE SEQUENCE myid START 0; 使⽤序列 INSERT INTO test VALUES 列出模式 (加 "+" 获取更多的信息) 开发指南 Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 105/206 \do [名字] 列出操作符 \dl 列出⼤对象, 和 lo_list ⼀样 \dp [模式] 列出表, 视图, 序列的访问权限 \dT [模式] 列出数据类型 (加 "+" 获取更多的信息) \du [模式] 列出⽤⼾0 码力 | 206 页 | 5.35 MB | 1 年前3 Greenplum数据仓库UDW - UCloud中立云计算服务商{ name: 'brown', height: 68 } 2 图形界⾯的⽅式访问 图形界⾯的⽅式访问UDW 2.1 配置 配置UDW外⽹访问 外⽹访问 udw默认是通过内⽹访问的,为了数据安全性,尽量不要通过外⽹访问UDW,如果需要图形界⾯的⽅式访问UDW,则需要配置udw的外⽹访问,请参考: 前提:有⼀台可以访问 udw 的 uhost,并且这台 uhost 上可以访问外⽹ ip。 p_store_sales (date); 7、序列 、序列 通过使⽤序列,系统可以在新的纪录插⼊表中时,⾃动地按照⾃增⽅式分配⼀个唯⼀ID。使⽤序列⼀般就是为插⼊表中的纪录⾃动分配⼀个唯⼀标识符。您可以通过声明⼀个 SERIAL 类型 的标识符列,该类型将会⾃动创建⼀个序列来分配 ID。 创建序列 CREATE SEQUENCE myid START 0; 使⽤序列 INSERT INTO test VALUES 列出模式 (加 "+" 获取更多的信息) 开发指南 Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 105/206 \do [名字] 列出操作符 \dl 列出⼤对象, 和 lo_list ⼀样 \dp [模式] 列出表, 视图, 序列的访问权限 \dT [模式] 列出数据类型 (加 "+" 获取更多的信息) \du [模式] 列出⽤⼾0 码力 | 206 页 | 5.35 MB | 1 年前3
 Pivotal Greenplum 5: 新一代数据平台如, 在 TPC-DS 中,111 个查询中有 46 个使用了 CTE。GPORCA 为 WITH 子句引入了一种新的生成者 - 使用者模式。利用该模 式,只需计算一个复杂表达式一次,便可由多个操作符使用其计算输出。这就使得 Pivotal Greenplum 能够处理复杂得多 的 CTE,因为它不必将其完全展开,只需对其进行动态处理即可。GPORCA 生成 CTE 计划的速度比传统规划器优化器平 要整理大型表中的数据,一种常见方法就是使用分区。Greenplum 5 采用 GPORCA 作为默认查询优化器,可确定消除与结 果无关的分区的经济方式,从而改进动态分区消除。这是通过引入以下三个新的查询操作符实现的,这三个操作符在生成 者 / 使用者模式下配合使用以便对分区表执行扫描:PartitionSelector、DynamicScan 和 Sequence。通过在查询计划中放置 这些 PartitionSelector,GPORCA Pivotal Greenplum 5 支持多种新的内置数据类型,并针对现有数据类型进行了改进。新增的类型包括符合 RFC 4122 和 ISO/IEC 9834-8:2005 标准的通用惟一标识符 (UUID)。JSON 类型可用于存储和处理不限长度的可变 JSON 数据,新 增了用于查询和解析 JSON 记录的内置函数。与 JSON 类似,HSTORE 可用于在数据库中存储和查询半结构化数据。0 码力 | 9 页 | 690.33 KB | 1 年前3 Pivotal Greenplum 5: 新一代数据平台如, 在 TPC-DS 中,111 个查询中有 46 个使用了 CTE。GPORCA 为 WITH 子句引入了一种新的生成者 - 使用者模式。利用该模 式,只需计算一个复杂表达式一次,便可由多个操作符使用其计算输出。这就使得 Pivotal Greenplum 能够处理复杂得多 的 CTE,因为它不必将其完全展开,只需对其进行动态处理即可。GPORCA 生成 CTE 计划的速度比传统规划器优化器平 要整理大型表中的数据,一种常见方法就是使用分区。Greenplum 5 采用 GPORCA 作为默认查询优化器,可确定消除与结 果无关的分区的经济方式,从而改进动态分区消除。这是通过引入以下三个新的查询操作符实现的,这三个操作符在生成 者 / 使用者模式下配合使用以便对分区表执行扫描:PartitionSelector、DynamicScan 和 Sequence。通过在查询计划中放置 这些 PartitionSelector,GPORCA Pivotal Greenplum 5 支持多种新的内置数据类型,并针对现有数据类型进行了改进。新增的类型包括符合 RFC 4122 和 ISO/IEC 9834-8:2005 标准的通用惟一标识符 (UUID)。JSON 类型可用于存储和处理不限长度的可变 JSON 数据,新 增了用于查询和解析 JSON 记录的内置函数。与 JSON 类似,HSTORE 可用于在数据库中存储和查询半结构化数据。0 码力 | 9 页 | 690.33 KB | 1 年前3
 深度揭秘Greenplum开源数据库透明加密GPDB的数据安全 用户 • 连接数据库 • 运行业务 DBA • 管理数据库 • 业务审计 System Admin • 管理集群 • 数据备份恢复 运行模式 GPDB的数据安全 用户 • 连接数据库 • 运行业务 DBA • 管理数据库 • 业务审计 System Admin • 管理集群 • 数据备份恢复 管理模式 GPDB的数据安全 用户 • • 业务审计 System Admin • 管理集群 • 数据备份恢复 管理模式 GPDB的数据安全 System Admin • 管理集群 • 数据备份恢复 GPDB为单独数据库软件 • 非一体机 • 缺少对硬件和系统的控制 潜在风险(一) GPDB的数据安全 System Admin • 管理集群 • 数据备份恢复 需要登录到系统进行运维 • 可以访问数据库二进制文件 可以访问预写日志文件 潜在风险(二) GPDB的数据安全 System Admin • 管理集群 • 数据备份恢复 运维模式 • 原厂服务,主机厂或者第三方运维 数据文件为明文二进制文件 • 直接通过Linux自带工具(strings, hexdump)访问 • pg_waldump可以直接读取并显示预写日志 潜在风险(三) GPDB的数据安全 数据需要加密 • 机密数据 • 知识产权保护0 码力 | 48 页 | 10.19 MB | 1 年前3 深度揭秘Greenplum开源数据库透明加密GPDB的数据安全 用户 • 连接数据库 • 运行业务 DBA • 管理数据库 • 业务审计 System Admin • 管理集群 • 数据备份恢复 运行模式 GPDB的数据安全 用户 • 连接数据库 • 运行业务 DBA • 管理数据库 • 业务审计 System Admin • 管理集群 • 数据备份恢复 管理模式 GPDB的数据安全 用户 • • 业务审计 System Admin • 管理集群 • 数据备份恢复 管理模式 GPDB的数据安全 System Admin • 管理集群 • 数据备份恢复 GPDB为单独数据库软件 • 非一体机 • 缺少对硬件和系统的控制 潜在风险(一) GPDB的数据安全 System Admin • 管理集群 • 数据备份恢复 需要登录到系统进行运维 • 可以访问数据库二进制文件 可以访问预写日志文件 潜在风险(二) GPDB的数据安全 System Admin • 管理集群 • 数据备份恢复 运维模式 • 原厂服务,主机厂或者第三方运维 数据文件为明文二进制文件 • 直接通过Linux自带工具(strings, hexdump)访问 • pg_waldump可以直接读取并显示预写日志 潜在风险(三) GPDB的数据安全 数据需要加密 • 机密数据 • 知识产权保护0 码力 | 48 页 | 10.19 MB | 1 年前3
 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum.............................................................................................. 8 安全可信 ................................................................................................ ....................................................................................... 11 利用容器实现安全分析 ................................................................................................ 务场景,能够处理多种并发混合工作负载,专为满足在多结构数据环境中进行实时分析的需求而设计。 欧拉开源操作系统是一款面向数字基础设施的操作系统,支持服务器、云计算、边缘计算、嵌入式等应用场景,支持多 样性计算,致力于提供安全、稳定、易用的操作系统。 Greenplum 与欧拉开源社区强强联手,不仅是双方业务用户所期盼的,同时也是 Greenplum 社区与对中国本地开源社 区的深入合作尝试。本次合作对双方打造丰富应用生态注入了鲜活动力!0 码力 | 17 页 | 2.04 MB | 1 年前3 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum.............................................................................................. 8 安全可信 ................................................................................................ ....................................................................................... 11 利用容器实现安全分析 ................................................................................................ 务场景,能够处理多种并发混合工作负载,专为满足在多结构数据环境中进行实时分析的需求而设计。 欧拉开源操作系统是一款面向数字基础设施的操作系统,支持服务器、云计算、边缘计算、嵌入式等应用场景,支持多 样性计算,致力于提供安全、稳定、易用的操作系统。 Greenplum 与欧拉开源社区强强联手,不仅是双方业务用户所期盼的,同时也是 Greenplum 社区与对中国本地开源社 区的深入合作尝试。本次合作对双方打造丰富应用生态注入了鲜活动力!0 码力 | 17 页 | 2.04 MB | 1 年前3
 Greenplum 排序算法● 第一阶段初始化TupleSort,通过调用函数tuplesort_begin_common,生成 Tuplesortstate。Tuplesortstate用于描述排序所需的信息 ● 第二阶段插入元组,每次调用函数puttuple_common,会根据当前TupleSort的 状态,选择将元组插入到不同的位置。 ● 第三阶段负责实际的排序逻辑,通过调用函数tuplesort_performsort,实现对已 经存储好的输入元组进行排序。根据当前TupleSort的不同状态,输入元组可能 存储在内存或者文件中,TupleSort会选择使用不同的算法进行排序。 ● 第四阶段负责输出排序后元组,在排序完成之后,每次调用函数 tuplesort_gettuple_common,即可获取排序后的元组。同样,根据当前 TupleSort的不同状态,算法选择不同的方式返回有序元组。 TupleSort 38 TupleSort0 码力 | 52 页 | 2.05 MB | 1 年前3 Greenplum 排序算法● 第一阶段初始化TupleSort,通过调用函数tuplesort_begin_common,生成 Tuplesortstate。Tuplesortstate用于描述排序所需的信息 ● 第二阶段插入元组,每次调用函数puttuple_common,会根据当前TupleSort的 状态,选择将元组插入到不同的位置。 ● 第三阶段负责实际的排序逻辑,通过调用函数tuplesort_performsort,实现对已 经存储好的输入元组进行排序。根据当前TupleSort的不同状态,输入元组可能 存储在内存或者文件中,TupleSort会选择使用不同的算法进行排序。 ● 第四阶段负责输出排序后元组,在排序完成之后,每次调用函数 tuplesort_gettuple_common,即可获取排序后的元组。同样,根据当前 TupleSort的不同状态,算法选择不同的方式返回有序元组。 TupleSort 38 TupleSort0 码力 | 52 页 | 2.05 MB | 1 年前3
 Greenplum分布式事务和两阶段提交协议k表里。 1. StartupXlog函数发现XLOG_XACT_PREPARE日志记录进行redo,调用函数recreateTwoPhaseFile将 该日志记录中的信息放到pg_twophase目录下的文件里,每一个prepared事务对应一个文件 2. StartupXlog函数调用recoverPreparedTransaction函数读取pg_twophase目录下的文件并进行相关操 TMGXACT 分布式事务结构体 • 分布式事务id • 分布式事务管理器启动的时间戳 • 活跃分布式事务中最小的事务id,分布式快照 • session id 34 Greenplum的两阶段提交函数调用关系 35 ● 事务的实现原理和Write Ahead Log(WAL) ● 分布式事务和两阶段提交的原理 ● Greenplum两阶段提交协议的实现 ● Greenplum两阶段提交协议的优化0 码力 | 42 页 | 2.12 MB | 1 年前3 Greenplum分布式事务和两阶段提交协议k表里。 1. StartupXlog函数发现XLOG_XACT_PREPARE日志记录进行redo,调用函数recreateTwoPhaseFile将 该日志记录中的信息放到pg_twophase目录下的文件里,每一个prepared事务对应一个文件 2. StartupXlog函数调用recoverPreparedTransaction函数读取pg_twophase目录下的文件并进行相关操 TMGXACT 分布式事务结构体 • 分布式事务id • 分布式事务管理器启动的时间戳 • 活跃分布式事务中最小的事务id,分布式快照 • session id 34 Greenplum的两阶段提交函数调用关系 35 ● 事务的实现原理和Write Ahead Log(WAL) ● 分布式事务和两阶段提交的原理 ● Greenplum两阶段提交协议的实现 ● Greenplum两阶段提交协议的优化0 码力 | 42 页 | 2.12 MB | 1 年前3
 Greenplum 编译安装和调试on Unix domain socket "/var/pgsql_socket/.s.PGSQL.5432"? 这个通常是由于不同的 psql binary 造成的,也就是说自己编译的 psql 调用了系统的 libpq 库。可以通过 ldd 或者 otool -L 查看。 解决方法: export LD_LIBRARY_PATH=/path/to/your/psql/lib 2 集群初始化工具 gpinitsystem 是Bash脚本工具,有些时候它的报错信息很不清楚。这个 时候可以 ○ 使用 -D 选项 ○ gp_bash_functions.sh 是内部一个被频繁调用执行系统命令的函数,可以通过 set -x 可以打印出所有执行的命令的详细信息。对调试 hang 问题很有效。 ● 在合适的代码处启用 Python 调试器,如果不知道什么地方合适,则在入口处。 的消息,则表示进程 attach成功,可以使用 clion进行调试了。 通过图像化窗口定位到 “ExecProcNode” 函数,通过单击下图的小红圈处,即可设置断点在 ExecAgg() 调用处。 执行 SELECT count(*) FROM students 语句,可以使用各种调试命令(例如单步执行、断点、跳 出函数等)方便的调试代码。 如上图所示,可以通过0 码力 | 15 页 | 2.07 MB | 1 年前3 Greenplum 编译安装和调试on Unix domain socket "/var/pgsql_socket/.s.PGSQL.5432"? 这个通常是由于不同的 psql binary 造成的,也就是说自己编译的 psql 调用了系统的 libpq 库。可以通过 ldd 或者 otool -L 查看。 解决方法: export LD_LIBRARY_PATH=/path/to/your/psql/lib 2 集群初始化工具 gpinitsystem 是Bash脚本工具,有些时候它的报错信息很不清楚。这个 时候可以 ○ 使用 -D 选项 ○ gp_bash_functions.sh 是内部一个被频繁调用执行系统命令的函数,可以通过 set -x 可以打印出所有执行的命令的详细信息。对调试 hang 问题很有效。 ● 在合适的代码处启用 Python 调试器,如果不知道什么地方合适,则在入口处。 的消息,则表示进程 attach成功,可以使用 clion进行调试了。 通过图像化窗口定位到 “ExecProcNode” 函数,通过单击下图的小红圈处,即可设置断点在 ExecAgg() 调用处。 执行 SELECT count(*) FROM students 语句,可以使用各种调试命令(例如单步执行、断点、跳 出函数等)方便的调试代码。 如上图所示,可以通过0 码力 | 15 页 | 2.07 MB | 1 年前3
 Greenplum 新一代数据管理和数据分析解决方案Enterprise Credibility Aging Proprietary Legacy Scalable, Open Software-Based Commodity HW • 用户人数 • 安全度 • 查询、报告、分析的数量 • 数据的高度多样性 • 大量定制数据 • 监管要求 商务智能/数据仓库发展趋势 一切都在增长! 数据仓库工作量:数据膨胀 面临的新难题是如何处理大规模数据 面临的新难题是如何处理大规模数据 过去的10年 现在 HPC 企业 SME 万亿字节 千兆字节 兆字节 千万亿字节 万亿字节 千兆字节 行业商务智能解决方案的实例 政府 电信 金融服务 公民服务 国家安全 电子政务 法规实施和监管 人力资本管理 信息传播 合规性报告 资产组合分析 客户报表 电汇通知 分部记分卡 客户关系管理、收 购和盈利率 欺诈检测 欺诈分析 客户流失分析 裁 Arnie Gullov-Singh 24 净数据规模 (TB) 2008年9月 2008年12月 客户实例:Reliance Communications • 业务问题 • CDR安全合规性和分析 • 已有方案 • Oracle • 数据规模 • 20TB,每天增长400GB • 优势 • 将响应时间缩短90% “借助运行Greenplum数据引擎的Sun数据仓库设0 码力 | 45 页 | 2.07 MB | 1 年前3 Greenplum 新一代数据管理和数据分析解决方案Enterprise Credibility Aging Proprietary Legacy Scalable, Open Software-Based Commodity HW • 用户人数 • 安全度 • 查询、报告、分析的数量 • 数据的高度多样性 • 大量定制数据 • 监管要求 商务智能/数据仓库发展趋势 一切都在增长! 数据仓库工作量:数据膨胀 面临的新难题是如何处理大规模数据 面临的新难题是如何处理大规模数据 过去的10年 现在 HPC 企业 SME 万亿字节 千兆字节 兆字节 千万亿字节 万亿字节 千兆字节 行业商务智能解决方案的实例 政府 电信 金融服务 公民服务 国家安全 电子政务 法规实施和监管 人力资本管理 信息传播 合规性报告 资产组合分析 客户报表 电汇通知 分部记分卡 客户关系管理、收 购和盈利率 欺诈检测 欺诈分析 客户流失分析 裁 Arnie Gullov-Singh 24 净数据规模 (TB) 2008年9月 2008年12月 客户实例:Reliance Communications • 业务问题 • CDR安全合规性和分析 • 已有方案 • Oracle • 数据规模 • 20TB,每天增长400GB • 优势 • 将响应时间缩短90% “借助运行Greenplum数据引擎的Sun数据仓库设0 码力 | 45 页 | 2.07 MB | 1 年前3
共 20 条
- 1
- 2













