Greenplum 编译安装和调试Terminal 4. 执行 csrutil disable 5. 重启操作系统 // 安装Greenplum管理脚本依赖的 Python 包 $ wget https://bootstrap.pypa.io/get-pip.py $ sudo python get-pip.py $ sudo pip install psutil lockfile paramiko setuptools b -L/usr/local/opt/openssl/lib" \ CFLAGS="-O0 -g3 -ggdb3" \ ./configure --with-perl --with-python --with-libxml \ --enable-debug --enable-cassert --disable-orca --disable-gpcloud \ --disable-gpfdist Greenplum Database 编译和运行依赖于各种系统库和Python库。需要先安装这些依赖: $ sudo yum groupinstall 'Development Tools' # GCC, libtools etc $ sudo yum install curl-devel bzip2-devel python-devel openssl-devel readline-devel0 码力 | 15 页 | 2.07 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1JDBC pgjdbc 可以从 GP 或者 PG 的官网获得。 Perl DBI pgperl http://gborg.postgresql.org/project/pgperl Python DBI pygresql http://www.pygresql.org 使用通用API来访问GP的说明: 1. 下载相应的语言和对应平台的API文件。例如下载JDK和JDBC。 timeout 参数,该参数指定一个毫秒数, 当事务排队时间超过这个设置时,将会被数据库中断。 要手动终止一个事务,首先要确定该查询相关的进程号(pid),得到了该 pid 之 后,通过调用 pg_cancel_backend()函数来终止该查询。 例如,通过如下语句查看所有资源组中正在执行和排队的语句,如果查询没有结果, 说明资源组中没有正在执行的事务或者排队的事务。 要转移一个派对和等待的事务,希望这方面可以得到改善。 调用 pg_resgroup_move_query()函数需要提供两个参数,PID 和新的资源组 名称。例如: =# SELECT gp_toolkit.pg_resgroup_move_query(2514,'default_group'); 在调用 pg_resgroup_move_query()函数时,该查询将受到新的资源组的配额0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 精粹文集计算的功能也无能为力,就其因估计还是受到 mysql 在这方面限制。 3) 扩展性方面,Postgresql 比 mysql 也要出色许多,Postgres 天生就 是 为 扩 展 而 生 的, 你 可 以 在 PG 中 用 Python、C、Perl、TCL、 PLSQL 等等语言来扩展功能,在后续章节中,我将展现这种扩展 是如何的方便,另外,开发新的功能模块、新的数据类型、新的索 引类型等等非常方便,只要按照 API 接口开发,无需对 的 功 能,Postgresql 中 的 功 能 模 块 和 接 口 基 本 上 99% 都 可 以 在 Greenplum 上 使 用, 例 如 odbc、jdbc、oledb、perldbi、python psycopg2 等,所以 Greenplum 与第三方工具、BI 报表集成的时候非 常容易;对于 postgresql 的 contrib 中的一些常用模块 Greenplum 提 供了编 前文提到,得益于 Postgresql 的良好扩展性(这里是 extension,不 是 scalability),Greenplum 可以采用各种开发语言来扩展用户自定 义函数(UDF)(我个人是 Python 和 C 的 fans,后续章节与大家分享)。 这些自定义函数部署到 Greenplum 后可用充分享受到实例级别的并行 性能优势,我们强烈建议用户将库外的处理逻辑,部署到用 MPP 数 据库的0 码力 | 64 页 | 2.73 MB | 1 年前3
并行不悖- OLAP 在互联网公司的实践与思考kettle调度 Ø单个存储过程,可以在shell中 select func_name() 的方式调度 • 外部任务调度 Ø将整个过程封装成shell脚本,或 Python脚本 Ø用crontab在操作系统调用脚本 Ø用 opencron在图形界面调用脚本 32 Greenplum运维体系 Greenplum任务调度-opencron 33 Greenplum现状说明 三 Greenplum体系架构0 码力 | 43 页 | 9.66 MB | 1 年前3
Greenplum 排序算法● 第一阶段初始化TupleSort,通过调用函数tuplesort_begin_common,生成 Tuplesortstate。Tuplesortstate用于描述排序所需的信息 ● 第二阶段插入元组,每次调用函数puttuple_common,会根据当前TupleSort的 状态,选择将元组插入到不同的位置。 ● 第三阶段负责实际的排序逻辑,通过调用函数tuplesort_performsort,实现对已 经存储好的输入元组进行排序。根据当前TupleSort的不同状态,输入元组可能 存储在内存或者文件中,TupleSort会选择使用不同的算法进行排序。 ● 第四阶段负责输出排序后元组,在排序完成之后,每次调用函数 tuplesort_gettuple_common,即可获取排序后的元组。同样,根据当前 TupleSort的不同状态,算法选择不同的方式返回有序元组。 TupleSort 38 TupleSort0 码力 | 52 页 | 2.05 MB | 1 年前3
Greenplum分布式事务和两阶段提交协议k表里。 1. StartupXlog函数发现XLOG_XACT_PREPARE日志记录进行redo,调用函数recreateTwoPhaseFile将 该日志记录中的信息放到pg_twophase目录下的文件里,每一个prepared事务对应一个文件 2. StartupXlog函数调用recoverPreparedTransaction函数读取pg_twophase目录下的文件并进行相关操 TMGXACT 分布式事务结构体 • 分布式事务id • 分布式事务管理器启动的时间戳 • 活跃分布式事务中最小的事务id,分布式快照 • session id 34 Greenplum的两阶段提交函数调用关系 35 ● 事务的实现原理和Write Ahead Log(WAL) ● 分布式事务和两阶段提交的原理 ● Greenplum两阶段提交协议的实现 ● Greenplum两阶段提交协议的优化0 码力 | 42 页 | 2.12 MB | 1 年前3
Greenplum 分布式数据库内核揭秘Greenplum、PostgreSQL、MySQL 以及 Oracle 等主流数据库均采用拉模型。 拉模型的每个算子都实现了从下层节点获取一条元组的 GetNext 函数,每次调用该函数都会从下 层节点返回一条元组或者 EOF 的 NULL 指针。上层节点不断地调用 GetNext 函数从下层节点获 取数据,直至数据全部获取完毕。 火山模型 postgres=# explain select * from t order0 码力 | 31 页 | 3.95 MB | 1 年前3
Greenplum数据仓库UDW - UCloud中立云计算服务商Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 7/206 1. Client:访问 UDW 的客⼾端 ⽀持通过 JDBC、ODBC、PHP、Python、命令⾏ Sql 等⽅式访问 UDW 2. Master Node:访问 UDW 数据仓库的⼊⼝ 接收客⼾端的连接请求 负责权限认证 处理 SQL 命令 调度分发执⾏计划 汇总 Segment Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 25/206 2.python客⼾端访问 $yum install python-psycopg2 ⽰例1. 连接UDW testconn.py #!/usr/bin/python import psycopg2 conn = psycopg2.connect(database="dev", host="hostIP", port="port") print "Opened database successfully" 执⾏ python testconn.py ⽰例2. 创建⼀个表 createTable.py #!/usr/bin/python import psycopg2 conn = psycopg2.connect(database="dev", user="username"0 码力 | 206 页 | 5.35 MB | 1 年前3
VMware Greenplum 6 DocumentationData Science Package for Python 433 Data Science Package for Python 2.7 Modules 434 Data Science Package for Python 3.9 Modules 437 Installing a Data Science Package for Python 442 Uninstalling a Data Data Science Package for Python 443 R Data Science Library Package 443 R Data Science Libraries 444 Installing the R Data Science Library Package 446 Uninstalling the R Data Science Library Package 447 Developing PL/Container functions 956 Basic Function Examples 958 About PL/Python 2 Functions in PL/Container 959 About PL/Python 3 Functions in PL/Container 960 Developing CUDA API Functions with PL/Container0 码力 | 2445 页 | 18.05 MB | 1 年前3
VMware Greenplum 6 DocumentationData Science Package for Python 440 Data Science Package for Python 2.7 Modules 440 Data Science Package for Python 3.9 Modules 443 Installing a Data Science Package for Python 448 Uninstalling a Data Data Science Package for Python 449 R Data Science Library Package 450 R Data Science Libraries 450 VMware Greenplum 6 Documentation VMware, Inc 18 Installing the R Data Science Library Package 451 Examples 947 VMware Greenplum 6 Documentation VMware, Inc 39 About PL/Python 2 Functions in PL/Container 948 About PL/Python 3 Functions in PL/Container 949 Developing CUDA API Functions with PL/Container0 码力 | 2374 页 | 44.90 MB | 1 年前3
共 30 条
- 1
- 2
- 3













