 Greenplum 精粹文集indd 1 16-11-22 下午3:38 2 由此,业界认识到对于海量数据需要一种新的计算模式来支持,这种 模式就是可以支持 Scale-out 横向扩展的分布式并行数据计算技术。 当时,开放的X86服务器技术已经能很好的支持商用,借助高速网络(当 时是千兆以太网)组建的 X86 集群在整体上提供的计算能力已大幅高 于传统 SMP 主机,并且成本很低,横向的扩展性还可带来系统良好 的成长性。 公司,创始人家门口有 一棵青梅 ——greenplum,因此而得名)召集了十几位业界大咖(据 说来自 google、yahoo、ibm 和 TD),说干就干,花了一年多的时间 完成最初的版本设计和开发,用软件实现了在开放 X86 平台上的分布 式并行计算,不依赖于任何专有硬件,达到的性能却远远超过传统高 昂的专有系统。 Big Date2.indd 2 16-11-22 下午3:38 Greenplum 还是建立在实例级别上的并行计算,可在一次 SQL 请求中利用到每个节点上的多个 CPU CORE 的计算能力,对 X86 的 CPU 超线程有很好的支持,提供更好的请求响应速度。在 PoC 中接触 到其它一些国内外基于开放平台的 MPP 软件,大都是建立在节点级的 并行,单个或少量的任务时无法充分利用资源,导致系统加载和 SQL 执行性能不高。 记忆较深的一次 PoC 公开测试中,有厂商要求在测试中关闭 CPU 超0 码力 | 64 页 | 2.73 MB | 1 年前3 Greenplum 精粹文集indd 1 16-11-22 下午3:38 2 由此,业界认识到对于海量数据需要一种新的计算模式来支持,这种 模式就是可以支持 Scale-out 横向扩展的分布式并行数据计算技术。 当时,开放的X86服务器技术已经能很好的支持商用,借助高速网络(当 时是千兆以太网)组建的 X86 集群在整体上提供的计算能力已大幅高 于传统 SMP 主机,并且成本很低,横向的扩展性还可带来系统良好 的成长性。 公司,创始人家门口有 一棵青梅 ——greenplum,因此而得名)召集了十几位业界大咖(据 说来自 google、yahoo、ibm 和 TD),说干就干,花了一年多的时间 完成最初的版本设计和开发,用软件实现了在开放 X86 平台上的分布 式并行计算,不依赖于任何专有硬件,达到的性能却远远超过传统高 昂的专有系统。 Big Date2.indd 2 16-11-22 下午3:38 Greenplum 还是建立在实例级别上的并行计算,可在一次 SQL 请求中利用到每个节点上的多个 CPU CORE 的计算能力,对 X86 的 CPU 超线程有很好的支持,提供更好的请求响应速度。在 PoC 中接触 到其它一些国内外基于开放平台的 MPP 软件,大都是建立在节点级的 并行,单个或少量的任务时无法充分利用资源,导致系统加载和 SQL 执行性能不高。 记忆较深的一次 PoC 公开测试中,有厂商要求在测试中关闭 CPU 超0 码力 | 64 页 | 2.73 MB | 1 年前3
 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum器、云计算、边缘计算、嵌入式等应用场景,支持多样性计算,致力于提供安全、稳定、易用的操作系统。通过为应用 提供确定性保障能力,支持 OT 领域应用及 OT 与 ICT 的融合。 欧拉开源社区通过开放的社区形式与全球的开发者共同构建一个开放、多元和架构包容的软件生态体系,孵化支持多种 处理器架构、覆盖数字设施全场景,推动企业数字基础设施软硬件、应用生态繁荣发展。 openEuler 作为一个操作系统发行版平台,每两年推出一个 至数百倍。其多种分析扩展功能支持 ANSI SQL,并通过封装扩展提供多种内置语言和附加功能。Greenplum 能够 管理各种规模的数据容量,数据量从数 GB 到数 PB 不等。 Greenplum 环境适用性强与其开放性、真正开源、社区活跃有密不可分的关系,一方面 Greenplum 能够独立于专用 硬件加速提供高性能的纯软件数据平台,无需专用硬件,另外一方面包括核心代码在内的全部开源,社区人员或客户 可最大化自由利用和借鉴 自从开源以来,可以通过 cn.greenplum.org 网站下载和编译的版本与商业版将具有相同的内核(只有 个别微小差别),这是近年来致力于扩展和融入以 Greenplum 为中心的生态系统和社区的结果,用户可基于开放的 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum 白皮书0 码力 | 17 页 | 2.04 MB | 1 年前3 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum器、云计算、边缘计算、嵌入式等应用场景,支持多样性计算,致力于提供安全、稳定、易用的操作系统。通过为应用 提供确定性保障能力,支持 OT 领域应用及 OT 与 ICT 的融合。 欧拉开源社区通过开放的社区形式与全球的开发者共同构建一个开放、多元和架构包容的软件生态体系,孵化支持多种 处理器架构、覆盖数字设施全场景,推动企业数字基础设施软硬件、应用生态繁荣发展。 openEuler 作为一个操作系统发行版平台,每两年推出一个 至数百倍。其多种分析扩展功能支持 ANSI SQL,并通过封装扩展提供多种内置语言和附加功能。Greenplum 能够 管理各种规模的数据容量,数据量从数 GB 到数 PB 不等。 Greenplum 环境适用性强与其开放性、真正开源、社区活跃有密不可分的关系,一方面 Greenplum 能够独立于专用 硬件加速提供高性能的纯软件数据平台,无需专用硬件,另外一方面包括核心代码在内的全部开源,社区人员或客户 可最大化自由利用和借鉴 自从开源以来,可以通过 cn.greenplum.org 网站下载和编译的版本与商业版将具有相同的内核(只有 个别微小差别),这是近年来致力于扩展和融入以 Greenplum 为中心的生态系统和社区的结果,用户可基于开放的 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum 白皮书0 码力 | 17 页 | 2.04 MB | 1 年前3
 Greenplum 新一代数据管理和数据分析解决方案性价比: 性能可达到传统方案(Oracle、Teradata)的 10到100倍, 而成本只是其一小部分 – 可伸缩性:从较低的万亿字节扩展到千万亿字节 – 开放式系统:在通用系统和开放源软件的基础上创建 前提条件 – 硬件:基于开放式标准硬件 – 软件:Postgres和Greenplum – 体系架构:海量并行处理体系,针对商务智能/数据仓库 进行了优化,解决了所有数据流瓶颈问题0 码力 | 45 页 | 2.07 MB | 1 年前3 Greenplum 新一代数据管理和数据分析解决方案性价比: 性能可达到传统方案(Oracle、Teradata)的 10到100倍, 而成本只是其一小部分 – 可伸缩性:从较低的万亿字节扩展到千万亿字节 – 开放式系统:在通用系统和开放源软件的基础上创建 前提条件 – 硬件:基于开放式标准硬件 – 软件:Postgres和Greenplum – 体系架构:海量并行处理体系,针对商务智能/数据仓库 进行了优化,解决了所有数据流瓶颈问题0 码力 | 45 页 | 2.07 MB | 1 年前3
 Greenplum数据仓库UDW - UCloud中立云计算服务商Copyright © 2012-2021 UCloud 优刻得 71/206 ssh -C -f -N -g -L 5432:10.10.10.1:5432 root@10.10.0.9 备注:请注意开放外⽹防⽕墙端⼝ 5432(也可以把 udw 端⼝映射到 uhost上其他端⼝上),⽹络防⽕墙配置请参考: https://docs.ucloud.cn/unet/firewall/introduction 168.120.110访问 udw。在 uhost 机器上执⾏如下命令: ssh -C -f -N -g -L 5432:10.10.10.1:5432 root@10.10.0.9 备注:请注意开放外⽹防⽕墙端⼝ 5432(也可以把 udw 端⼝映射到 uhost上其他端⼝上),⽹络防⽕墙配置请参考:https://docs.ucloud.cn/unet/firewall/introduction0 码力 | 206 页 | 5.35 MB | 1 年前3 Greenplum数据仓库UDW - UCloud中立云计算服务商Copyright © 2012-2021 UCloud 优刻得 71/206 ssh -C -f -N -g -L 5432:10.10.10.1:5432 root@10.10.0.9 备注:请注意开放外⽹防⽕墙端⼝ 5432(也可以把 udw 端⼝映射到 uhost上其他端⼝上),⽹络防⽕墙配置请参考: https://docs.ucloud.cn/unet/firewall/introduction 168.120.110访问 udw。在 uhost 机器上执⾏如下命令: ssh -C -f -N -g -L 5432:10.10.10.1:5432 root@10.10.0.9 备注:请注意开放外⽹防⽕墙端⼝ 5432(也可以把 udw 端⼝映射到 uhost上其他端⼝上),⽹络防⽕墙配置请参考:https://docs.ucloud.cn/unet/firewall/introduction0 码力 | 206 页 | 5.35 MB | 1 年前3
 Pivotal Greenplum 5.0 - 开源MPP 数据库的不二之选开源 MPP 数据库的不二之选: Pivotal Greenplum 5.0 姚延栋 yyao@pivotal.io 开放源代码 SQL 企业级数据库 生态系统 MPP 高速数据加载 多态存储 表‘SALES’ 列存储 行存储 1月 一年前 二年前 外部表 12月 11月 4月0 码力 | 18 页 | 913.39 KB | 1 年前3 Pivotal Greenplum 5.0 - 开源MPP 数据库的不二之选开源 MPP 数据库的不二之选: Pivotal Greenplum 5.0 姚延栋 yyao@pivotal.io 开放源代码 SQL 企业级数据库 生态系统 MPP 高速数据加载 多态存储 表‘SALES’ 列存储 行存储 1月 一年前 二年前 外部表 12月 11月 4月0 码力 | 18 页 | 913.39 KB | 1 年前3
 Greenplum 介绍接口进行数据分析,大大降低了数据分 析的门槛;MADlib 内建于数据库内,使用 MPP 的优势,提高了分析的效率;MADlib 可 以在全量数据而不是抽样数据上进行分析,提高了精度。 ● 开放源代码且持续大力投入的平台: 2017 年 Pivotal 在 github 的开源贡献列表中全球排 名第四左右。 采用开源方案,不担心后门问题,不担心被锁定。开源还可以构建更好的 生态。 ●0 码力 | 3 页 | 220.42 KB | 1 年前3 Greenplum 介绍接口进行数据分析,大大降低了数据分 析的门槛;MADlib 内建于数据库内,使用 MPP 的优势,提高了分析的效率;MADlib 可 以在全量数据而不是抽样数据上进行分析,提高了精度。 ● 开放源代码且持续大力投入的平台: 2017 年 Pivotal 在 github 的开源贡献列表中全球排 名第四左右。 采用开源方案,不担心后门问题,不担心被锁定。开源还可以构建更好的 生态。 ●0 码力 | 3 页 | 220.42 KB | 1 年前3
 Greenplum机器学习⼯具集和案例强大的灵活性、可扩展:PL/X、Extension、PXF、外部表机制 • 完善的标准支持:SQL、JDBC、ODBC • 集成数据平台:BI/DW、文本、GIS、图、图像、机器学习 • 开放源代码,持续大力投入 • 敏捷方法学:快速迭代、持续发布、质量内建 • 企业级稳定性,成熟生态系统 2017.thegiac.com Greenplum: 机器学习工具集 20170 码力 | 58 页 | 1.97 MB | 1 年前3 Greenplum机器学习⼯具集和案例强大的灵活性、可扩展:PL/X、Extension、PXF、外部表机制 • 完善的标准支持:SQL、JDBC、ODBC • 集成数据平台:BI/DW、文本、GIS、图、图像、机器学习 • 开放源代码,持续大力投入 • 敏捷方法学:快速迭代、持续发布、质量内建 • 企业级稳定性,成熟生态系统 2017.thegiac.com Greenplum: 机器学习工具集 20170 码力 | 58 页 | 1.97 MB | 1 年前3
 Pivotal Greenplum 5: 新一代数据平台可消除平台 / 供应商制约。用户可通过不同供应商获得针对 Greenplum 的服务和支持。 • Greenplum Database 在开发时采用的是以社区 / 客户为焦点的开发模式。客户可通过多种开放可用的方法对总 体产品方向产生影响,而这又会加快产品创新。 客户能够在群集中的一组初始服务器上部署 Pivotal Greenplum,并能在数据存储和用户需求增加时扩充配置中的服务器数 量,且无0 码力 | 9 页 | 690.33 KB | 1 年前3 Pivotal Greenplum 5: 新一代数据平台可消除平台 / 供应商制约。用户可通过不同供应商获得针对 Greenplum 的服务和支持。 • Greenplum Database 在开发时采用的是以社区 / 客户为焦点的开发模式。客户可通过多种开放可用的方法对总 体产品方向产生影响,而这又会加快产品创新。 客户能够在群集中的一组初始服务器上部署 Pivotal Greenplum,并能在数据存储和用户需求增加时扩充配置中的服务器数 量,且无0 码力 | 9 页 | 690.33 KB | 1 年前3
 Greenplum Database 管理员指南 6.2.1在 GP 中使用索引 在大多数的OLTP数据库中,索引可以显著的改善数据访问的性能。然而在分布式 数据库(例如GP)中,应该谨慎使用索引。GP执行顺序扫描已经很快,而索引是通过随 机寻址在磁盘上定位数据记录,两者适用场景不同。与传统的OLTP数据库不同的是, GP中数据是分布在多个Instance上的。这意味着每个Instance都扫描全部数据的一 小部分来查找结果。如果使用了分区0 码力 | 416 页 | 6.08 MB | 1 年前3 Greenplum Database 管理员指南 6.2.1在 GP 中使用索引 在大多数的OLTP数据库中,索引可以显著的改善数据访问的性能。然而在分布式 数据库(例如GP)中,应该谨慎使用索引。GP执行顺序扫描已经很快,而索引是通过随 机寻址在磁盘上定位数据记录,两者适用场景不同。与传统的OLTP数据库不同的是, GP中数据是分布在多个Instance上的。这意味着每个Instance都扫描全部数据的一 小部分来查找结果。如果使用了分区0 码力 | 416 页 | 6.08 MB | 1 年前3
共 9 条
- 1













