自动重试机制 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Greenplum Database 管理员指南 6.2.1

目前，GP 还不支持 Master 的自动故障切换，不过，已经有很多人适用工具或者脚本的形式实现了 Master 和 Standby 的自动 FailOver 效果，编者也实现了自动切换命令，当 Master 出现无法正常工作的故障时，自动激活 Standby 来接管 Master 的任务。下面的流程图，是编者实现的 Master 和 Standby 自动切换的逻辑流程图，可以供读者参考，不过，编者不方便公开实现的代码。版本来说，和 4 版本与 5 版本是不同的，因为 6 版本中，系统表中记录 Mirror 关系的系统表设计已经发生了重大变化。 Mirror 使得数据库查询在 Primary 不可用时可以自动切换到 Mirror 上。为了配置 Mirror，GP 系统需要有足够多的主机，从而可以确保作为冗余角色的 Mirror 总是位于与 Primary 不同的 Host 主机上，否则，一旦主机发生宕机故障，位于同一 18616691889) 编写：陈淼 - 17 - Instance 故障切换与恢复在 GP 系统启用 Mirror 的情况下，当 Primary 不可访问时，Master 会自动将任务切换到对应的 Mirror 上，此时，Mirror 取代 Primary 的作用继续提供服务。只要剩余的可用 Instance 能够保证数据的完整性，在 Instance 或者 Host 主机宕

0 码力 | 416 页 | 6.08 MB | 1 年前
3
Greenplum 精粹文集

数据库实例同时开展并行计算。而且，这些 Postgresql 之间采用 share- nothing 无共享架构，从而更将这种并行计算能力发挥到极致，除此之外，MPP 采用两阶段提交和全局事务管理机制来保证集群上分布式事务的一致性，Greenplum 像 Postgresql 一样满足关系型数据库的包括 ACID 在内的所有特征。从上图可以看到，Greenplum 的最小并行单元不是节点层级，而是在 ·行、列混合存储 ·数据表多级分区 ·Bitmap 索引 ·Hadoop 外部表 ·Gptext 全文检索 ·并行查询计划优化器和 Orca 优化器 ·Primary/Mirror 镜像保护机制 ·资源队列管理 ·WEB/Brower 监控 Big Date2.indd 7 16-11-22 下午3:38 8 3. Greenplum 的艺术 -- Parallel Everything 按照我们在用户现场观察到的，Master 上的资源消耗很少有超过 20% 情况发生，因为 Segment 才是计算和加载发生的场所（当然，在 HA 方面，Greenplum 提供 Standby Master 机制进行保证）。再进一步看，Master-Slave 架构在业界的大数据分布式计算和云计算体系中被广泛应用，大家可以看到，现在主流分布式系统都是采用 Master-Slave 架构，包括：Hadoop

0 码力 | 64 页 | 2.73 MB | 1 年前
3
Greenplum on Kubernetes 容器化MPP数据库

半结构化/无模式 ○ 数据隔离 → 数据共享 ● 云数据库市场巨大 ● 云数据库增速巨大 ● DBasS的需求 ● 跨云的需求云数据库实现方案云数据库需求 ● DBasS ○ 自动化运维 ○ 自动化调优 ● 弹性资源管理 ○ 存储资源 ○ 计算资源 ● 安全 ○ 用户数据 ○ 临时文件 ○ 网络传输 ○ 权限控制 ● 跨云 ○ 公有云 ○ 私有云云数据库实现方案存储计算分离 ○ PV持久化存储资源 ○ StatefulSet/Pod弹性扩展计算资源 ● 数据库服务层 ○ Service统一Master & Standby Master地址 ● 服务发现机制 ○ 所有节点地址名不变 ● 跨云能力 ○ 容器应用对基础设施透明 Greenplum Operator Kubernetes Operator ● 自定义资源类型 ○ Custom Resource m Operator ● 集群自动部署 ○ kube-scheduler → 自定义部署策略 ● 集群动态扩容 ○ GreenplumCluster → primarySegmentCount参数 ● Master节点检测及修复 ○ 自动执行gpactivatestandby ○ 重定向Service路由 ● Segment节点检查及修复 ○ 自动执行gprecoverseg ○

0 码力 | 33 页 | 1.93 MB | 1 年前
3
Pivotal Greenplum 最佳实践分享

Truncate操作不会丢失字段级统计信息，在适当条件下可仅针对系统字段执行Analyze 垃圾空间回收 • GPDB采用MVCC机制，UPDATE 或 DELETE并非物理删除，而只是对无效记录做标记； • Update/delete操作后，数据库不会自动释放这些空间，这些垃圾空间的回收方式： 1）Vacuum 2）Vacuum full 3）REORGANIZE GPDB中关闭了Autovacuum（GPDB 4.2.6 UPPER）  Age的监控：  xid_warn_limit:500000000（5亿）,AGE大于5亿自动告警  xid_stop_limit: 1000000000， AGE大于10亿停止工作，等待vacuum执行数据库对象数上限的最佳实践  GPDB内部的对象：所有的表（包括分区表）、索引、视图等都称为对象 xlog日志等，需要说明的是，未得到support同意，不要用pg_resetxlog去修復xlog，否则可能导致数据不一致；  故障机器隔离当发现有机器本身有故障，例如经常性自动重启、硬盘问题时，可以将机器进行隔离（关闭），Primary将自动切换到Mirror节点；  Vacuum系统表，修改错误page 如果系统表有故障，或者发现对系统表的操作（select count（*）from pg

0 码力 | 41 页 | 1.42 MB | 1 年前
3
Greenplum机器学习⼯具集和案例

各种数据格式：结构化、半结构化（JSON/XML/Hstore)、非结构化 • 强大内核: MPP、优化器、多态存储、灵活分区、高速加载、PG内核 • 强大的灵活性、可扩展：PL/X、Extension、PXF、外部表机制 • 完善的标准支持：SQL、JDBC、ODBC • 集成数据平台：BI/DW、文本、GIS、图、图像、机器学习 • 开放源代码，持续大力投入 • 敏捷方法学：快速迭代、持续发布、质量内建很多⼿手动步骤，易易出错客户数据科学解决⽅方案 ● 某⼤大型跨国多元化传媒和娱乐公司 ● 简化Data 流程 ● 在Madlib上重新建模和预测 ● 实现流程全⾃自动化背景 2017.thegiac.com 数据源 • 客户数据 - 购买 - 预定 - 营销 - 在线注册 - ⽹网⻚页浏览历史 - 地理理信息数据 X 对Pivotal产品线不不熟悉 ✓ 在Greenplum上充分利用了MADlib 和PL/X X 在SAS和Excel上有很多⼿手动流程 ✓ 在Greenplum内部实现了了流程⾃自动化 X 代码复杂冗余，很多数据类型转换 ✓ 代码更更精简，更更便便于维护的代码 X 原始模型预测效果不不理理想 ✓ 新模型能够更更精准地预测⽬目标客户商业影响 2017

0 码力 | 58 页 | 1.97 MB | 1 年前
3
Greenplum数据库架构分析及5.x新功能分享

Confidential–Inter nal Use Only 平台概况产品特性客户端访问和工具多级容错机制无共享大规模并行处理先进的查询优化器多态存储系统客户端访问 ODBC, JDBC, OLEDB, etc. 核心MPP 架构并行数据流引擎高速软数据交换机制 MPP Scatter/Gather 流处理在线系统扩展任务管理服务加载 & 数据联邦高速数据加载

0 码力 | 44 页 | 8.35 MB | 1 年前
3
Greenplum资源管理器

portal – SQL结束不一定释放slot – 一个事务用光所有slot 2017 年象行中国（杭州站）第一期 Resource Queue • System PANIC – 需要睡眠/唤醒机制 – Count + LWLock + Lock • Count：记录并发数 • LWLock：保护count • Lock：睡眠/唤醒，死锁检测，状态报告 – 维护Lock在共享内存的状态 –

0 码力 | 21 页 | 756.29 KB | 1 年前
3
Greenplum备份恢复浅析

segment的数据一致性但是，各个segment的数据设置隔离级别的动作存在时间差，而master仍然接受新的事务，从而导致各个segment上的数据不一致。我们可以通过实现barrier机制来避免这种情况： 1. 使数据库只读 2. 等待所有的事务全部提交，开始备份 3. 给pg_class加锁，等待每个segment备份时设置隔离级别为串行化，恢复数据库为可读可写并⾏备份恢复优化(3/3)

0 码力 | 17 页 | 1.29 MB | 1 年前
3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

.................................................................................... 11 Master 节点自动 Failover ......................................................................................... 图 3：Greenplum 多站点复制 Master 节点自动 Failover Greenplum 7 将实现 Master 的自动 Failover,当 Coordinator（Master），如果 Coordinator（Master）出现故障，将自动把备用节点进行替换，把这一流程自动化，减少人工的干预，这一功能不但将解决现有用户的使用痛点，同时也大大增加了系白皮书 12 白皮书 | 12 图 4：Greenplum 管理节点 Master 自动 Failover Greenplum 在 OLAP 方面继续保持领先与创新，打造统一分析全平台，综合多种技术给用户提供了分析便利，可以选择自己擅长的工具及利用遗留的知识和技能，特别适合拥有多种技能的团队。

0 码力 | 17 页 | 2.04 MB | 1 年前
3
Greenplum开源MPP数据库介绍

数据交换信道 Confidential │ ©2022 VMware, Inc. 8 Greenplum的高可用 Ø 数据存两份，Coordinator有standby Ø 自动同步数据 (WAL replication) Ø 自动灾难恢复 (FTS，主备切换) Confidential │ ©2022 VMware, Inc. 9 分布式优化器：OLAP Ø OLTP系统的SQL语句相对简单（CURD）

0 码力 | 23 页 | 4.55 MB | 1 年前
3

共 14 条前往

页

分类

语言

格式

Greenplum Database 管理员指南 6.2.1

Greenplum 精粹文集

Greenplum on Kubernetes 容器化MPP数据库

Pivotal Greenplum 最佳实践分享

Greenplum机器学习⼯具集和案例

Greenplum数据库架构分析及5.x新功能分享

Greenplum资源管理器

Greenplum备份恢复浅析

完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

Greenplum开源MPP数据库介绍