Greenplum Database 管理员指南 6.2.1目前,GP 还不支持 Master 的自动故障切换,不过,已经有很多人适用工具或者 脚本的形式实现了 Master 和 Standby 的自动 FailOver 效果,编者也实现了自动 切换命令,当 Master 出现无法正常工作的故障时,自动激活 Standby 来接管 Master 的任务。下面的流程图,是编者实现的 Master 和 Standby 自动切换的逻辑流程图, 可以供读者参考,不过,编者不方便公开实现的代码。 版本来说,和 4 版本与 5 版本是不同的,因为 6 版本中,系统表中记录 Mirror 关系 的系统表设计已经发生了重大变化。 Mirror 使得数据库查询在 Primary 不可用时可以自动切换到 Mirror 上。为了 配置 Mirror,GP 系统需要有足够多的主机,从而可以确保作为冗余角色的 Mirror 总是位于与 Primary 不同的 Host 主机上,否则,一旦主机发生宕机故障,位于同一 18616691889) 编写:陈淼 - 17 - Instance 故障切换与恢复 在 GP 系统启用 Mirror 的情况下,当 Primary 不可访问时,Master 会自动将 任务切换到对应的 Mirror 上,此时,Mirror 取代 Primary 的作用继续提供服务。 只要剩余的可用 Instance 能够保证数据的完整性,在 Instance 或者 Host 主机宕0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 精粹文集数 据库实例同时开展并行计算。而且,这些 Postgresql 之间采用 share- nothing 无共享架构,从而更将这种并行计算能力发挥到极致,除此之 外,MPP 采用两阶段提交和全局事务管理机制来保证集群上分布式事 务的一致性,Greenplum 像 Postgresql 一样满足关系型数据库的包括 ACID 在内的所有特征。 从上图可以看到,Greenplum 的最小并行单元不是节点层级,而是在 ·行、列混合存储 ·数据表多级分区 ·Bitmap 索引 ·Hadoop 外部表 ·Gptext 全文检索 ·并行查询计划优化器和 Orca 优化器 ·Primary/Mirror 镜像保护机制 ·资源队列管理 ·WEB/Brower 监控 Big Date2.indd 7 16-11-22 下午3:38 8 3. Greenplum 的艺术 -- Parallel Everything 按照我们在用户现场观察到的,Master 上的资源消耗很少有超过 20% 情况发生,因为 Segment 才是计算和加载发生的场所(当然, 在 HA 方面,Greenplum 提供 Standby Master 机制进行保证)。 再进一步看,Master-Slave 架构在业界的大数据分布式计算和云计 算体系中被广泛应用,大家可以看到,现在主流分布式系统都是采 用 Master-Slave 架 构, 包 括:Hadoop0 码力 | 64 页 | 2.73 MB | 1 年前3
Greenplum on Kubernetes
容器化MPP数据库半结构化/无模式 ○ 数据隔离 → 数据共享 ● 云数据库市场巨大 ● 云数据库增速巨大 ● DBasS的需求 ● 跨云的需求 云数据库实现方案 云数据库需求 ● DBasS ○ 自动化运维 ○ 自动化调优 ● 弹性资源管理 ○ 存储资源 ○ 计算资源 ● 安全 ○ 用户数据 ○ 临时文件 ○ 网络传输 ○ 权限控制 ● 跨云 ○ 公有云 ○ 私有云 云数据库实现方案 存储计算分离 ○ PV持久化存储资源 ○ StatefulSet/Pod弹性扩展计算资源 ● 数据库服务层 ○ Service统一Master & Standby Master地址 ● 服务发现机制 ○ 所有节点地址名不变 ● 跨云能力 ○ 容器应用对基础设施透明 Greenplum Operator Kubernetes Operator ● 自定义资源类型 ○ Custom Resource m Operator ● 集群自动部署 ○ kube-scheduler → 自定义部署策略 ● 集群动态扩容 ○ GreenplumCluster → primarySegmentCount参数 ● Master节点检测及修复 ○ 自动执行gpactivatestandby ○ 重定向Service路由 ● Segment节点检查及修复 ○ 自动执行gprecoverseg ○0 码力 | 33 页 | 1.93 MB | 1 年前3
Pivotal Greenplum 最佳实践分享Truncate操作不会丢失字段级统计信息,在适当条件下可仅针对系统字段执行Analyze 垃圾空间回收 • GPDB采用MVCC机制,UPDATE 或 DELETE并非物理删除,而只是对无效记 录做标记; • Update/delete操作后,数据库不会自动释放这些空间,这些垃圾空间的回收方 式: 1)Vacuum 2)Vacuum full 3)REORGANIZE GPDB中关闭了Autovacuum(GPDB 4.2.6 UPPER) Age的监控: xid_warn_limit:500000000(5亿),AGE大于5亿自动告警 xid_stop_limit: 1000000000, AGE大于10亿停止工作,等待vacuum执行 数据库对象数上限的最佳实践 GPDB内部的对象:所有的表(包括分区表)、索引、视图等都称为对象 xlog日志等,需要说明的是,未得到support同意,不要用pg_resetxlog去修復xlog,否则可能导致数据不一致; 故障机器隔离 当发现有机器本身有故障,例如经常性自动重启、硬盘问题时,可以将机器进行隔离(关闭),Primary将自动切换到Mirror节点; Vacuum系统表,修改错误page 如果系统表有故障,或者发现对系统表的操作(select count(*)from pg0 码力 | 41 页 | 1.42 MB | 1 年前3
Greenplum机器学习⼯具集和案例各种数据格式:结构化、半结构化(JSON/XML/Hstore)、非结构化 • 强大内核: MPP、优化器、多态存储、灵活分区、高速加载、PG内核 • 强大的灵活性、可扩展:PL/X、Extension、PXF、外部表机制 • 完善的标准支持:SQL、JDBC、ODBC • 集成数据平台:BI/DW、文本、GIS、图、图像、机器学习 • 开放源代码,持续大力投入 • 敏捷方法学:快速迭代、持续发布、质量内建 很多⼿手动步骤,易易 出错 客户 数据科学解决⽅方案 ● 某⼤大型跨国多元 化传媒和娱乐公 司 ● 简化Data 流程 ● 在Madlib上重新建 模和预测 ● 实现流程全⾃自动化 背景 2017.thegiac.com 数据源 • 客户数据 - 购买 - 预定 - 营销 - 在线注册 - ⽹网⻚页浏览历史 - 地理理信息数据 X 对Pivotal产品线不不熟悉 ✓ 在Greenplum上充分利用了MADlib 和PL/X X 在SAS和Excel上有很多⼿手动流程 ✓ 在Greenplum内部实现了了流程⾃自动 化 X 代码复杂冗余,很多数据类型 转换 ✓ 代码更更精简,更更便便于维护的代码 X 原始模型预测效果不不理理想 ✓ 新模型能够更更精准地预测⽬目标客 户 商业影响 20170 码力 | 58 页 | 1.97 MB | 1 年前3
Greenplum数据库架构分析及5.x新功能分享Confidential–Inter nal Use Only 平台概况 产品特性 客户端访问和工具 多级容错机制 无共享大规模并行处理 先进的查询优化器 多态存储系统 客户端访问 ODBC, JDBC, OLEDB, etc. 核心MPP 架构 并行数据流引擎 高速软数据交换机制 MPP Scatter/Gather 流处理 在线系统扩展 任务管理 服务 加载 & 数据联邦 高速数据加载0 码力 | 44 页 | 8.35 MB | 1 年前3
Greenplum资源管理器portal – SQL结束不一定释放slot – 一个事务用光所有slot 2017 年象行中国(杭州 站)第一期 Resource Queue • System PANIC – 需要睡眠/唤醒机制 – Count + LWLock + Lock • Count:记录并发数 • LWLock:保护count • Lock:睡眠/唤醒,死锁检测,状态报告 – 维护Lock在共享内存的状态 –0 码力 | 21 页 | 756.29 KB | 1 年前3
Greenplum备份恢复浅析segment的数据一致性 但是,各个segment的数据设置隔离级别的动作存在时间差, 而master仍然接受新的事务,从而导致各个segment上的数 据不一致。我们可以通过实现barrier机制来避免这种情况: 1. 使数据库只读 2. 等待所有的事务全部提交,开始备份 3. 给pg_class加锁,等待每个segment备份时设置隔离级别 为串行化,恢复数据库为可读可写 并⾏备份恢复优化(3/3)0 码力 | 17 页 | 1.29 MB | 1 年前3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum.................................................................................... 11 Master 节点自动 Failover ......................................................................................... 图 3:Greenplum 多站点复制 Master 节点自动 Failover Greenplum 7 将实现 Master 的自动 Failover,当 Coordinator(Master),如果 Coordinator(Master)出现故障, 将自动把备用节点进行替换,把这一流程自动化,减少人工的干预,这一功能不但将解决现有用户的使用痛点,同时 也大大增加了系 白皮书 12 白皮书 | 12 图 4:Greenplum 管理节点 Master 自动 Failover Greenplum 在 OLAP 方面继续保持领先与创新,打造统一分析全平台,综合多种技术给用户提供了分析便利,可以 选择自己擅长的工具及利用遗留的知识和技能,特别适合拥有多种技能的团队。0 码力 | 17 页 | 2.04 MB | 1 年前3
Greenplum开源MPP数据库介绍数据交换信道 Confidential │ ©2022 VMware, Inc. 8 Greenplum的高可用 Ø 数据存两份,Coordinator有standby Ø 自动同步数据 (WAL replication) Ø 自动灾难恢复 (FTS,主备切换) Confidential │ ©2022 VMware, Inc. 9 分布式优化器:OLAP Ø OLTP系统的SQL语句相对简单(CURD)0 码力 | 23 页 | 4.55 MB | 1 年前3
共 14 条
- 1
- 2













