Brin Index主Greenplum 7中的理论与实现0 码力 | 32 页 | 1.04 MB | 1 年前3
 Greenplum Database 管理员指南 6.2.1mytable; 要得到关于 psql 客户端应用程序的更多信息,可以查看 PostgreSQL 的相关文档。 针对 GP 的 pgAdminIII 如果更喜欢图形化界面(有谁不喜欢呢),可以使用针对 GP 的 pgAdminIII。该 GUI 客户端除了支持标准 PostgreSQL 外,还支持一些 GP 的专有特性。 针对 GP 的 pgAdminIII 用于配置每个主机上最大分配给 GP Instance 的 CPU 资源的百分比。不管使用哪种 CPU 配额模式,该参数都控制着所有 资源组的最大 CPU 使用率。其余的资源需要留给操作系统和数据库的主服务进程使用。 参数 gp_resource_group_cpu_limit 的缺省值为 0.9(90%)。 注意:如果在 GP 集群的主机上还有其他程序,gp_resource_group_cpu_limit 需要调整该参数。 注意:应该尽量避免将 gp_resource_group_cpu_limit 设置为大于 0.9,这样可 能会导致 GP 工作负载抢占所有的 CPU 资源,从而影响数据库的主服务进程获取不到足 够的 CPU 资源。 按照 Core 来配额 CPU 使用 CPUSET 属性来指定哪些 CPU 的 Core 为资源组专用,被指定的 Core 必须0 码力 | 416 页 | 6.08 MB | 1 年前3
 Greenplum 编译安装和调试开源社区最新源代码 6X_STABLE 分支: https://github.com/greenplum-db/gpdb,内核代码基于 PostgreSQL 9.4。目前(2019/04/23) 主 干分支的代码基于 PostgreSQL 9.4。合并到 PostgreSQL 9.5 的工作也已经开始,有关最新工作 进展请参见:https://github.com/greenplum-db/g 供了非常直观、强大、易用的调试环境,包括 clion、eclipse、xcode 等。IDE 对于学习 Greenplum 代码也非常有帮助,可以大大提高效率。 下面简单介绍如何使用 clion 图形化用户界面调试 Greenplum 代码。(Eclipse、VisualCode具有 类似功能) Greenplum 进程都是 daemon 进程,很难通过启动方式进入调试器。因而通常使用的方法是 attach0 码力 | 15 页 | 2.07 MB | 1 年前3
 并行不悖- OLAP 在互联网公司的实践与思考业务数据的中转 —— ETL服务器 • 3 数据的存储和计算 —— OLAP集群 • 4 结果数据的展现 —— 数据集市 • 5 访问接口的封装 —— API接口服务器 • 6 最终数据的显示 —— 前端界面 • 7 结果数据的交互 —— OLTP,趋势分析 • 8 OLAP数据流转 —— dbsync平台 7 数据仓库体系架构 数据架构示意图 8 数据仓库体系架构 架构的具体技术实现 • datax,csv,load,copy Ø 数据同步结果确认与显示 • 数据同步方式 Ø gpfdist+外部表 : UMGW大表 Ø db_sync同步程序 : 底层库 + 同步逻辑 + Django界面 Ø 临时同步需求: datax , copy 29 Greenplum运维体系 数据库数据传输与同步-db_sync 30 Greenplum运维体系 数据库数据传输与同步-db_sync Ø单个存储过程,可以在shell中 select func_name() 的方式调度 • 外部任务调度 Ø将整个过程封装成shell脚本,或 Python脚本 Ø用crontab在操作系统调用脚本 Ø用 opencron在图形界面调用脚本 32 Greenplum运维体系 Greenplum任务调度-opencron 33 Greenplum现状说明 三 Greenplum体系架构 二 数据仓库体系架构 一 Greenplum开发规范0 码力 | 43 页 | 9.66 MB | 1 年前3
 Greenplum数据库架构分析及5.x新功能分享GP Workload Manager 7 Pivotal Confidential–Inter nal Use Only MPP(大规模并行处理)无共享体系架构 从主节点 … 主节点 SQL • 主节点和从主节点,主节点负责协调整个集群 • 一个数据节点可以配置多个节点实例(Segment Instances) • 节点实例并行处理查询(SQL) • 数据节点有自己的CPU、磁盘和 大规模并行数据加载 • 高速数据导入和导出 – 主节点不是瓶颈 – 10+ TB/小时/Rack – 线性扩展 • 低延迟 – 加载后立刻可用 – 不需要中间存储 – 不需要额外数据处理 • 导入/导出 到&从: – 文件系统 – 任意 ETL 产品 – Hadoop 发行版 外部数据源 Interconnect ... ... ... ... 主节点 查询优化和调度 数据节点 存储数据 Confidential–Inter nal Use Only 解析器 主节点Segment 系统表 优化器 分布式事务 调度器 执行器 解析器执行词法分 析、语法分析并生 成 解析树 客户端 主节点接受客户连接, 处理请求,执行认证 解析器 主节点 17 Pivotal Confidential–Inter nal Use Only 优化器 本地存储 主节点Segment 系统表 分布式事务 Interconnect0 码力 | 44 页 | 8.35 MB | 1 年前3
 基于 Greenplum 打造SaaS化电商服务平台担极端复杂的在线分 析,有待验证 数据集市 报表 CRM 胜算 …… …… …… …… 数据仓库演变 2015 2016 2017 2018 2019 2014原始阶段 2016.4全新报表界面:梳理业务、开发报表 2016.9自建GP集群,上线工作量统计 2018.3HDB4PG 2017.1报表全面迁移至GP 2017.6集群拆分 2018.9全面切换HDB4PG 20180 码力 | 7 页 | 547.94 KB | 1 年前3
 Greenplum数据仓库UDW - UCloud中立云计算服务商DEFAULT } ALTER DATABASE 名字 RESET 参数 ALTER DATABASE 名字 RENAME TO 新名字 ALTER DATABASE 名字 OWNER TO 新属主 命令: ALTER FUNCTION 描述: 改变⼀个函数的定义 语法: 开发指南 Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 ALTER FUNCTION 名字 ( [ 类型 [, ...] ] ) RENAME TO 新名字 ALTER FUNCTION 名字 ( [ 类型 [, ...] ] ) OWNER TO 新属主 命令: ALTER GROUP 描述: 改变⼀个⽤⼾组 语法: ALTER GROUP 组名称 ADD USER ⽤⼾名称 [, ... ] ALTER GROUP 组名称 DROP Copyright © 2012-2021 UCloud 优刻得 108/206 ALTER SCHEMA 名字 RENAME TO 新名字 ALTER SCHEMA 名字 OWNER TO 新属主 命令: ALTER SEQUENCE 描述: 改变⼀个序列⽣成器的定义 语法: ALTER SEQUENCE 名字 [ INCREMENT [ BY ] 递增 ] [ MINVALUE0 码力 | 206 页 | 5.35 MB | 1 年前3
 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplumprimary 和 mirror 节点,一旦主节点 出现故障,会用从节点来替代,但这仅限于一个数据中心内部。整个事务提交是同步的,当主集群提交事务时,需要 等备集群把日志传到主集群才能提交,对于跨区域或者是两地三中心数据中心来说,保证完全同步的开销是很难接受 的,针对这种情况,Greenplum 7 版本采用了多个集群间异步的方式来处理,来确保数据同步。这样备份集群和主 集群之间可能会存在延迟,延迟的0 码力 | 17 页 | 2.04 MB | 1 年前3
 Greenplum上云与优化支持,需要停机(数分钟) 索引 支持(B-tree、Bitmap) 不支持 2016Postgres中国用户大会 推荐应用架构 应用服务器 ECS VPC ApsaraDB for GP 主节点 子节点 子节点 子节点 子节点 子节点 子节点 子节点 子节点 应用服务器 应用服务器 阿里云服务 阿里云CDP服务 应用服务器 Tableau 应用服务器 2016Postgres中国用户大会 2016Postgres中国用户大会 ApsaraDB for GP架构 ApsaraDB for GP 主节点 子节点 子节点 子节点 子节点 子节点 子节点 子节点 子节点 万兆网(同交换机) 物理机(SSD/SATA) 2016Postgres中国用户大会 支持OSS外部表读写 主节点 子节点 子节点 子节点 子节点 子节点 子节点 子节点 子节点 Insert0 码力 | 26 页 | 1.13 MB | 1 年前3
 Greenplum备份恢复浅析数据恢复(2/2) 2017 年象行中国(杭州 站)第一期 虽然并行备份和恢复大大提高了备份和恢复的速度,但是仍 然存在很多问题: 1. 大量数据需要落盘 2. 使用dbid作为备份文件命名规则,在主备切换或者 primary和mirror后会出现问题 3. 可能会出现各个segment数据不一致的情况 …... 并⾏备份恢复存在的问题 2017 年象行中国(杭州 站)第一期 并⾏备份恢复优化(1/3) 并⾏备份恢复优化(1/3) OSS uploader uploader uploader 2017 年象行中国(杭州 站)第一期 并⾏备份恢复优化(2/3) 使用dbid作为备份文件命名规则,在主备切换或者primary 和mirror后会出现问题,例如: dbid=2 dbid=5 primary mirror test_gp_dump_0_2_20170206160253.gz master0 码力 | 17 页 | 1.29 MB | 1 年前3
共 14 条
- 1
 - 2
 













