Greenplum Database 管理员指南 6.2.1协议外部表导出数据 ................................................................... - 258 - 使用基于命令的 WEB 型外部表导出数据 ............................................................. - 259 - 使用 COPY 命令导入导出 ...... .................................................................................... - 409 - 低内存消耗型的查询 .............................................................................................. - .................................................................................... - 411 - 低内存消耗型的查询 .............................................................................................. -0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 精粹文集贡 献力量。 2) 为什么是 Postgresql 而不是其它的? 我想大家可能主要想问为什么是 Postgresql 而不是 Mysql ?(其实, 还有很多开源关系型数据库,但相比这两个主流开源库,实在不在 一个起跑线上)。我们无意去从技术点上PK这两个数据库孰优孰劣, 我相信它们的存在都有各自的特点,它们都有成熟的开源社区做支 持,有各自的庞大的 fans 群众基础。我们认为,Greenplum Postgresql 号称最先进的数据库(官方主页“The world’s most advanced open source database”), 且不管这是不是自我标榜, 就从 OLAP 分析型方面来考察,以下几点 Postgresql 确实胜出一筹。 Big Date2.indd 4 16-11-22 下午3:38 Greenplum 精粹文集 5 1) PG 有非常强大 nothing 无共享架构,从而更将这种并行计算能力发挥到极致,除此之 外,MPP 采用两阶段提交和全局事务管理机制来保证集群上分布式事 务的一致性,Greenplum 像 Postgresql 一样满足关系型数据库的包括 ACID 在内的所有特征。 从上图可以看到,Greenplum 的最小并行单元不是节点层级,而是在 实例层级。安装过 Greenplum 的同学应该都看到每个实例都有自己 的 Postgresql0 码力 | 64 页 | 2.73 MB | 1 年前3
Greenplum数据仓库UDW - UCloud中立云计算服务商配置 配置 存储密集型 ds1.large 4核 24G 2000G(SATA) 存储密集型 ds1.6xlarge 24核 144G 12000G(SATA) 计算密集型 dc1.large 2核 12G 300G(SSD) 快速上⼿ Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 11/206 计算密集型 dc1.8xlarge UCloud 优刻得 82/206 udw 的数据类型和 postgresql 基本⼀致,在选择数据类型的时候应该尽可能占⽤空间⼩,同时能够保证存储所有可能的数值并且最合理地表达数据。 使⽤字符型数据类型保存字符串,⽇期或者⽇期时间戳类型保存⽇期类型,数值类型来保存数值。 使⽤ VARCHAR 或者 TEXT 来保存⽂本类数据。不推荐使⽤ CHAR 类型保存⽂本类型。VARCHAR 或 TEXT 年) 计算密集型 dc1.large 2核 12G 300G(SSD) 700 7000 存储密集型 ds1.large 4核 24G 2000G(SATA)1500 15000 ⾼IO独享型 dc2.large 8核 32G 900G(SSD) 2300 23000 RSSD云盘型 rc1.large 4核 32G 600G(SSD) 1500 15000 RSSD云盘型 rc1.xlarge0 码力 | 206 页 | 5.35 MB | 1 年前3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum私有云)中。Greenplum 6 及未来发布的 Greenplum 7 丰富的 HTAP 特性,具备良好性能、可靠性和稳定性,使得 Greenplum 不仅可以作为全能的分析化平台,也能满足交易型业 务场景,能够处理多种并发混合工作负载,专为满足在多结构数据环境中进行实时分析的需求而设计。 欧拉开源操作系统是一款面向数字基础设施的操作系统,支持服务器、云计算、边缘计算、嵌入式等应用场景,支持多 高性能的纯软件数据平台,Greenplum 可根据 客户需求在任何位置运行。借助这种“不受限于基础架构”的方法,可以在本地不同的操作系统、不同的芯片环境或多 云环境(私有云或公有云)中部署同一类型的分析数据库。这种不受限于基础架构的方法的大部分优势都具有同样强 大的作用,那就是可以消除对第三方平台、供应商制约,助用户实现选择自由。 Greenplum 保持着真正开源、完全开放的初心,获得广泛的技术认可,随着 openEuler DB SIG 联合在 openEuler 20.03 LTS SP2 上进行 了 TPC-DS 性能测试。测试过程如下: a. TPC-DS 介绍 TPC-DS 采用星型、雪花型等多维数据模式。包含 7 张事实表、17 张维度表,平均每张表含有 18 列,其工作负载包 含 99 个 SQL 查询,覆盖 SQL99 和 2003 的核心部分以及 OLAP。这个测试集包含对大数据集的统计、报表生成、联0 码力 | 17 页 | 2.04 MB | 1 年前3
Greenplum 介绍标准,具备强大、 高效、安全的 PB 级结构化、半结构化和非结构化数据存储、处理和实时分析能力,可部署于企 业裸机、容器、私有云和公有云中。值得一提的是,作为 OLAP 型的大数据平台, Greenplum 同 时还能够支持涵盖 OLTP 型业务的混合负载,从而帮助客户真正打通业务-数据-洞见-业务的闭环。 目前,Greenplum 已经为国内外各行各业客户所广泛使用,支撑着全球各大行业的核心生产系统,0 码力 | 3 页 | 220.42 KB | 1 年前3
Greenplum 6: 混合负载的理想数据平台混合负载的理想数据平台 高小明 全球领先的开源MPP大数据平台 可扩展性 ACID事务 VS 分布式 简单易用 VS 结构化 半结构非结构化 VS 事务型 分析型 VS MPP - massively parallel processing - 大规模并行处理 master standby primary segment mirror segment0 码力 | 52 页 | 4.48 MB | 1 年前3
Greenplum 新一代数据管理和数据分析解决方案com www.greenplum-china.com Greenplum:简介 Greenplum数据引擎软件为新一代数 据仓库所需的大规模数据和复杂查询功 能所设计 3 推动数据依赖型企业的发展 全球各地的一些Greenplum客户 4 亚太地区 欧洲、中东、非洲 北美 中国的客户 5 金融 交通 互联网 其它 Teradata Netezza Oracle Greenplum 今天的数据库供应商 网络运算的发展速度已经超过了主流数据库 • 海量规模 • 高性价比 • 高效率 数据库管理系统(DBMS)的 规模/容量 11 需要采用一种新的方法 •“一切皆可商用”:商业即用型x86 服务器、存储设备、网络 •通过软件很容易将处理能力扩展到 1000s的内核/系统 Greenplum • “黑盒子” • “大铁箱” • 大磁盘 过去Google™ 曾经用来实现信息搜索功能的技术,0 码力 | 45 页 | 2.07 MB | 1 年前3
Greenplum开源MPP数据库介绍Confidential │ ©2022 VMware, Inc. 3 Greenplum简介:什么是Greenplum? 基于PostgreSQL、开源、分布式MPP、ACID完备、为OLAP优化的关系型数据仓库。 https://greenplum.org https://github.com/greenplum-db/gpdb Confidential │ ©2022 VMware, Inc0 码力 | 23 页 | 4.55 MB | 1 年前3
Greenplum 分布式数据库内核揭秘和线性拓展能力,内置并行存储、并行通信、并行计算和并行优化功能,兼容 SQL 标准。拥有独 特的高效的 ORCA 优化器,具有强大、高效的 PB 级数据存储、处理和实时分析能力,同时支持 OLTP 型业务的混合负载。 Greenplum 分布式数据库简介 5 Confidential │ ©2021 VMware, Inc. Greenplum 集群化概述 Coordinator/Segment0 码力 | 31 页 | 3.95 MB | 1 年前3
Greenplum机器学习⼯具集和案例据分析团队缺乏技 能 客户 数据科学解决⽅方案 ● 某⼤大型跨国⾦金金 融服务公司 ● 移动应⽤用 API 分析 ● 使⽤用Madlib进⾏行行聚 类分析,建⽴立会话 识别模型和主题模 型 ● 建⽴立scoring pipeline, 对新访问 的安全性进⾏行行评估 ● 使⽤用可视化⼯工具对 结果进⾏行行更更好地呈 现 背景 2017.thegiac.com0 码力 | 58 页 | 1.97 MB | 1 年前3
共 11 条
- 1
- 2













