Greenplum 介绍MPP(大规模并行处理)架构构建,具有良好的弹性和线性扩展能力,并内置 并行存储、并行通讯、并行计算和优化技术。同时,Greenplum 还兼容 SQL 标准,具备强大、 高效、安全的 PB 级结构化、半结构化和非结构化数据存储、处理和实时分析能力,可部署于企 业裸机、容器、私有云和公有云中。值得一提的是,作为 OLAP 型的大数据平台, Greenplum 同 时还能够支持涵盖 OLTP 型业务的混 Kafka、Hadoop、HIVE、 HBase、S3、Gemfire、各种数据库和文件等,不需要移动数据,避免了数据加载的复杂 性,和其带来的数据不一致的问题。 ● 支持各种数据格式的平台:不管是结构化、半结构化(XML、JSON、KV)还是非结构化, 譬如文本数据、GIS 数据、图数据等。 ● 具有强大内核的平台:Greenplum 具有强大的内核技术,包括数据水平分布、并行查询执 行、专业优化器、线性扩展能力0 码力 | 3 页 | 220.42 KB | 1 年前3
Pivotal Greenplum 5: 新一代数据平台Manager 多态存储 Command Center SQL 兼容性 (Hyper-Q) PostgreSQL 内核 JSON、Apache AVRO、Apache Parquet 和 XML 结构化数据 pivotal.io/cn 白皮书 5 © Copyright 2017 Pivotal Software, Inc.保留所有权利。 PIVOTAL GREENPLUM 5:新一代数据平台 增了用于查询和解析 JSON 记录的内置函数。与 JSON 类似,HSTORE 可用于在数据库中存储和查询半结构化数据。 Greenplum 中添加的全新 PostgreSQL 9.1 函数和 SQL 命令增强了对 XML 的支持。这些新数据类型及相关函数有助于打造 一个没有孤岛的环境,结构化、半结构化和非结构化数据均可在一个位置进行存储和分析。其他功能还有 dblink,这是一 个用于与其他数据库(无论在同0 码力 | 9 页 | 690.33 KB | 1 年前3
Greenplum机器学习⼯具集和案例Greenplum ⼤大数据平台 • 一次打包,到处运行:裸机、私有云、公有云 • 各种数据源:Hadoop、S3、数据库、文件、Spark、Ka,a • 各种数据格式:结构化、半结构化(JSON/XML/Hstore)、非结构化 • 强大内核: MPP、优化器、多态存储、灵活分区、高速加载、PG内核 • 强大的灵活性、可扩展:PL/X、Extension、PXF、外部表机制 • 完0 码力 | 58 页 | 1.97 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1-- 大量的分析查询但却极少的数据修改。不适 合大量并发事务更新数据的OLTP类型应用。 和B-tree相比,Bitmap索引的使用应该更保守。建议在建立Bitmap索引之后做 必要的测试以证明其可以对查询性能有改善(相对于做全表扫描查询)。另外,最好跟 其他索引类型做必要的对比,就编者的经验来看,正如前面[何时使用位图索引]章节 的[注意]部分所述,可能在很多需要使用索引的时候,直接选择B-tree就足够了,使 以前有不少人以写得出一个巨大无比的单条SQL搞定一个复杂的问题而自我陶醉, 带来的后续维护问题是痛苦的,反而拆分为多个相对简单的步骤更便于排查问题和 维护。编者认为,优雅而高效的解决问题才最重要,故意把问题复杂化不值得提倡, 那不能证明能力。 定义一个大而全的视图,涉及很多表,然后可以用于各种场景 -- 这种设计也是 极其糟糕的,乍一看很酷,实际上,因为适用的场景多,就很难兼顾到每个场景, 所以,可能有的场景SQL 查询是一个查看、修改或者分析数据库中数据的命令。本节介绍如何在GP中构造 SQL查询。 SQL修辞 SQL值表达式 SQL 修辞 SQL(结构化查询语言)是用来访问数据库的一种语言。SQL语言有特定的修辞和词 法(单词、特征等),据此构造数据库引擎可以理解的查询或命令。 SQL由一系列的命令组成。命令由一系列按照语法规范编写的修辞组成,以分号(;)0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 6: 混合负载的理想数据平台Greenplum 6: 混合负载的理想数据平台 高小明 全球领先的开源MPP大数据平台 可扩展性 ACID事务 VS 分布式 简单易用 VS 结构化 半结构非结构化 VS 事务型 分析型 VS MPP - massively parallel processing - 大规模并行处理 master standby primary0 码力 | 52 页 | 4.48 MB | 1 年前3
Greenplum on Kubernetes
容器化MPP数据库云数据库背景 云数据库背景 ● 资源变化 ○ 本地资源 → 云 ○ 静态资源 → 弹性需求 ● 数据变化 ○ 内部数据 → 多数据源 ○ 数据规模 → 不易预测 ○ 数据格式 → 半结构化/无模式 ○ 数据隔离 → 数据共享 ● 云数据库市场巨大 ● 云数据库增速巨大 ● DBasS的需求 ● 跨云的需求 云数据库实现方案 云数据库需求 ● DBasS ○ 自动化运维0 码力 | 33 页 | 1.93 MB | 1 年前3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum| 4 关于本白皮书 近日,Greenplum 社区和欧拉开源社区深化合作,在欧拉开源操作系统(openEuler, 简称“欧拉”)编译测试了高级分 析数据平台 Greenplum,用实践证明了 Greenplum 与支持多样性计算的欧拉开源操作系统完全兼容,是 Greenplum 与中国本地 IT 厂商的深入合作的典型模板,大大丰富了中国本地国产化应用生态。本白皮书着眼介绍了欧拉开源操作系0 码力 | 17 页 | 2.04 MB | 1 年前3
共 7 条
- 1













