主界面 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Brin Index主Greenplum 7中的理论与实现

0 码力 | 32 页 | 1.04 MB | 1 年前
3
Greenplum Database 管理员指南 6.2.1

mytable; 要得到关于 psql 客户端应用程序的更多信息，可以查看 PostgreSQL 的相关文档。针对 GP 的 pgAdminIII 如果更喜欢图形化界面(有谁不喜欢呢)，可以使用针对 GP 的 pgAdminIII。该 GUI 客户端除了支持标准 PostgreSQL 外，还支持一些 GP 的专有特性。针对 GP 的 pgAdminIII 用于配置每个主机上最大分配给 GP Instance 的 CPU 资源的百分比。不管使用哪种 CPU 配额模式，该参数都控制着所有资源组的最大 CPU 使用率。其余的资源需要留给操作系统和数据库的主服务进程使用。参数 gp_resource_group_cpu_limit 的缺省值为 0.9(90%)。注意：如果在 GP 集群的主机上还有其他程序，gp_resource_group_cpu_limit 需要调整该参数。注意：应该尽量避免将 gp_resource_group_cpu_limit 设置为大于 0.9，这样可能会导致 GP 工作负载抢占所有的 CPU 资源，从而影响数据库的主服务进程获取不到足够的 CPU 资源。按照 Core 来配额 CPU 使用 CPUSET 属性来指定哪些 CPU 的 Core 为资源组专用，被指定的 Core 必须

0 码力 | 416 页 | 6.08 MB | 1 年前
3
Greenplum 编译安装和调试

开源社区最新源代码 6X_STABLE 分支： https://github.com/greenplum-db/gpdb，内核代码基于 PostgreSQL 9.4。目前（2019/04/23) 主干分支的代码基于 PostgreSQL 9.4。合并到 PostgreSQL 9.5 的工作也已经开始，有关最新工作进展请参见：https://github.com/greenplum-db/g 供了非常直观、强大、易用的调试环境，包括 clion、eclipse、xcode 等。IDE 对于学习 Greenplum 代码也非常有帮助，可以大大提高效率。下面简单介绍如何使用 clion 图形化用户界面调试 Greenplum 代码。（Eclipse、VisualCode具有类似功能） Greenplum 进程都是 daemon 进程，很难通过启动方式进入调试器。因而通常使用的方法是 attach

0 码力 | 15 页 | 2.07 MB | 1 年前
3
并行不悖- OLAP 在互联网公司的实践与思考

业务数据的中转 —— ETL服务器 • 3 数据的存储和计算 —— OLAP集群 • 4 结果数据的展现 —— 数据集市 • 5 访问接口的封装 —— API接口服务器 • 6 最终数据的显示 —— 前端界面 • 7 结果数据的交互 —— OLTP，趋势分析 • 8 OLAP数据流转 —— dbsync平台 7 数据仓库体系架构数据架构示意图 8 数据仓库体系架构架构的具体技术实现 • datax,csv,load,copy Ø 数据同步结果确认与显示 • 数据同步方式 Ø gpfdist+外部表： UMGW大表 Ø db_sync同步程序：底层库 + 同步逻辑 + Django界面 Ø 临时同步需求： datax , copy 29 Greenplum运维体系数据库数据传输与同步-db_sync 30 Greenplum运维体系数据库数据传输与同步-db_sync Ø单个存储过程，可以在shell中 select func_name() 的方式调度 • 外部任务调度 Ø将整个过程封装成shell脚本，或 Python脚本 Ø用crontab在操作系统调用脚本 Ø用 opencron在图形界面调用脚本 32 Greenplum运维体系 Greenplum任务调度-opencron 33 Greenplum现状说明三 Greenplum体系架构二数据仓库体系架构一 Greenplum开发规范

0 码力 | 43 页 | 9.66 MB | 1 年前
3
Greenplum数据库架构分析及5.x新功能分享

GP Workload Manager 7 Pivotal Confidential–Inter nal Use Only MPP(大规模并行处理）无共享体系架构从主节点 … 主节点 SQL • 主节点和从主节点，主节点负责协调整个集群 • 一个数据节点可以配置多个节点实例（Segment Instances) • 节点实例并行处理查询（SQL） • 数据节点有自己的CPU、磁盘和大规模并行数据加载 • 高速数据导入和导出 – 主节点不是瓶颈 – 10+ TB/小时/Rack – 线性扩展 • 低延迟 – 加载后立刻可用 – 不需要中间存储 – 不需要额外数据处理 • 导入/导出到&从: – 文件系统 – 任意 ETL 产品 – Hadoop 发行版外部数据源 Interconnect ... ... ... ... 主节点查询优化和调度数据节点存储数据 Confidential–Inter nal Use Only 解析器主节点Segment 系统表优化器分布式事务调度器执行器解析器执行词法分析、语法分析并生成解析树客户端主节点接受客户连接，处理请求，执行认证解析器主节点 17 Pivotal Confidential–Inter nal Use Only 优化器本地存储主节点Segment 系统表分布式事务 Interconnect

0 码力 | 44 页 | 8.35 MB | 1 年前
3
基于 Greenplum 打造SaaS化电商服务平台

担极端复杂的在线分析，有待验证数据集市报表 CRM 胜算 …… …… …… …… 数据仓库演变 2015 2016 2017 2018 2019 2014原始阶段 2016.4全新报表界面：梳理业务、开发报表 2016.9自建GP集群，上线工作量统计 2018.3HDB4PG 2017.1报表全面迁移至GP 2017.6集群拆分 2018.9全面切换HDB4PG 2018

0 码力 | 7 页 | 547.94 KB | 1 年前
3
Greenplum数据仓库UDW - UCloud中立云计算服务商

DEFAULT } ALTER DATABASE 名字 RESET 参数 ALTER DATABASE 名字 RENAME TO 新名字 ALTER DATABASE 名字 OWNER TO 新属主命令: ALTER FUNCTION 描述: 改变⼀个函数的定义语法: 开发指南 Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 ALTER FUNCTION 名字 ( [ 类型 [, ...] ] ) RENAME TO 新名字 ALTER FUNCTION 名字 ( [ 类型 [, ...] ] ) OWNER TO 新属主命令: ALTER GROUP 描述: 改变⼀个⽤⼾组语法: ALTER GROUP 组名称 ADD USER ⽤⼾名称 [, ... ] ALTER GROUP 组名称 DROP Copyright © 2012-2021 UCloud 优刻得 108/206 ALTER SCHEMA 名字 RENAME TO 新名字 ALTER SCHEMA 名字 OWNER TO 新属主命令: ALTER SEQUENCE 描述: 改变⼀个序列⽣成器的定义语法: ALTER SEQUENCE 名字 [ INCREMENT [ BY ] 递增 ] [ MINVALUE

0 码力 | 206 页 | 5.35 MB | 1 年前
3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

primary 和 mirror 节点，一旦主节点出现故障，会用从节点来替代，但这仅限于一个数据中心内部。整个事务提交是同步的，当主集群提交事务时，需要等备集群把日志传到主集群才能提交，对于跨区域或者是两地三中心数据中心来说，保证完全同步的开销是很难接受的，针对这种情况，Greenplum 7 版本采用了多个集群间异步的方式来处理，来确保数据同步。这样备份集群和主集群之间可能会存在延迟，延迟的

0 码力 | 17 页 | 2.04 MB | 1 年前
3
Greenplum上云与优化

支持，需要停机（数分钟）索引支持（B-tree、Bitmap）不支持 2016Postgres中国用户大会推荐应用架构应用服务器 ECS VPC ApsaraDB for GP 主节点子节点子节点子节点子节点子节点子节点子节点子节点应用服务器应用服务器阿里云服务阿里云CDP服务应用服务器 Tableau 应用服务器 2016Postgres中国用户大会 2016Postgres中国用户大会 ApsaraDB for GP架构 ApsaraDB for GP 主节点子节点子节点子节点子节点子节点子节点子节点子节点万兆网（同交换机）物理机（SSD/SATA） 2016Postgres中国用户大会支持OSS外部表读写主节点子节点子节点子节点子节点子节点子节点子节点子节点 Insert

0 码力 | 26 页 | 1.13 MB | 1 年前
3
Greenplum备份恢复浅析

数据恢复(2/2) 2017 年象行中国（杭州站）第一期虽然并行备份和恢复大大提高了备份和恢复的速度，但是仍然存在很多问题： 1. 大量数据需要落盘 2. 使用dbid作为备份文件命名规则，在主备切换或者 primary和mirror后会出现问题 3. 可能会出现各个segment数据不一致的情况 …... 并⾏备份恢复存在的问题 2017 年象行中国（杭州站）第一期并⾏备份恢复优化(1/3) 并⾏备份恢复优化(1/3) OSS uploader uploader uploader 2017 年象行中国（杭州站）第一期并⾏备份恢复优化(2/3) 使用dbid作为备份文件命名规则，在主备切换或者primary 和mirror后会出现问题，例如： dbid=2 dbid=5 primary mirror test_gp_dump_0_2_20170206160253.gz master

0 码力 | 17 页 | 1.29 MB | 1 年前
3

共 14 条前往

页

分类

语言

格式

Brin Index主Greenplum 7中的理论与实现

Greenplum Database 管理员指南 6.2.1

Greenplum 编译安装和调试

并行不悖- OLAP 在互联网公司的实践与思考

Greenplum数据库架构分析及5.x新功能分享

基于 Greenplum 打造SaaS化电商服务平台

Greenplum数据仓库UDW - UCloud中立云计算服务商

完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

Greenplum上云与优化

Greenplum备份恢复浅析