 Greenplum 6: 混合负载的理想数据平台id loop execute 'DROP TABLE IF EXISTS out, out_summary;'; execute 'SELECT madlib.graph_bfs(''people'',''id'',''links'',NULL,'||v1.id||',''out'');' ; select 1 into linkchk from out and st_makepoint() 计算给定经纬 度方圆2KM的范围 GPText.search() 函数可 以知道是否一个人在 Pivotal工作 Greenplum MADlib BFS 算法可以 知道两个之间是否有直接联系 Greenplum模糊字符串匹 配函数Soundex() 可以 知道姓名是否发音是 ‘Pavan’或‘Peter’ Greenplum Time 函数计算240 码力 | 52 页 | 4.48 MB | 1 年前3 Greenplum 6: 混合负载的理想数据平台id loop execute 'DROP TABLE IF EXISTS out, out_summary;'; execute 'SELECT madlib.graph_bfs(''people'',''id'',''links'',NULL,'||v1.id||',''out'');' ; select 1 into linkchk from out and st_makepoint() 计算给定经纬 度方圆2KM的范围 GPText.search() 函数可 以知道是否一个人在 Pivotal工作 Greenplum MADlib BFS 算法可以 知道两个之间是否有直接联系 Greenplum模糊字符串匹 配函数Soundex() 可以 知道姓名是否发音是 ‘Pavan’或‘Peter’ Greenplum Time 函数计算240 码力 | 52 页 | 4.48 MB | 1 年前3
 Greenplum 介绍、美国国家税务局、美联储、三星、戴尔、福特、 爱立信等,国内客户包括深交所、建设银行、民生银行、广大银行、浦发银行、航旅纵横、中国 移动、华为等。自 2015 年开源以来,更是吸引了包括阿里云、百度云、中移动、旷世、去哪儿 网、易观、腾云科技、饿了么、金风科技在内大量开源用户。 Greenplum 大数据平台的优势 ● 一次打包到处运行的平台:部署灵活,不受限于硬件环境和平台,无论裸机、私有云、公 个半月一个版本的发布速度。Greenplum 主干分支(master)开发非常活跃,众多社区 期待的特性稳健推进中,包括内核升级、新课题,处于业界领先地位。 Greenplum 社区邀请 Pivotal、阿里云、百度等社区人士共同定期举办各种技术研讨会、技术沙龙、 101 培训等活动,获得良好反馈。国内多所知名大学开设了 Greenplum 相关数据库课程,并在学 术领域取得了突出成就。 Greenplum0 码力 | 3 页 | 220.42 KB | 1 年前3 Greenplum 介绍、美国国家税务局、美联储、三星、戴尔、福特、 爱立信等,国内客户包括深交所、建设银行、民生银行、广大银行、浦发银行、航旅纵横、中国 移动、华为等。自 2015 年开源以来,更是吸引了包括阿里云、百度云、中移动、旷世、去哪儿 网、易观、腾云科技、饿了么、金风科技在内大量开源用户。 Greenplum 大数据平台的优势 ● 一次打包到处运行的平台:部署灵活,不受限于硬件环境和平台,无论裸机、私有云、公 个半月一个版本的发布速度。Greenplum 主干分支(master)开发非常活跃,众多社区 期待的特性稳健推进中,包括内核升级、新课题,处于业界领先地位。 Greenplum 社区邀请 Pivotal、阿里云、百度等社区人士共同定期举办各种技术研讨会、技术沙龙、 101 培训等活动,获得良好反馈。国内多所知名大学开设了 Greenplum 相关数据库课程,并在学 术领域取得了突出成就。 Greenplum0 码力 | 3 页 | 220.42 KB | 1 年前3
 Greenplum Database 管理员指南 6.2.1........................................................................................ - 272 - 文件系统要求 ............................................................................................... ........................................................................................ - 385 - 文件系统 ................................................................................................. 表空间(tablespace)允许Database管理员使用多个文件系统来存储数据库对 象,从而可以决定如何更好的利用他们的物理储存设备。表空间的存在有具体的意义, 例如在访问频度不同的数据库对象上使用不同性能的磁盘,例如,将经常使用的表放在 高性能磁盘的文件系统上(例如SSD固态盘),而将其他表放在普通硬盘的文件系统上。 一个表空间,在GP集群中,对应的是一组分布式的操作系统目录,在每个Instance0 码力 | 416 页 | 6.08 MB | 1 年前3 Greenplum Database 管理员指南 6.2.1........................................................................................ - 272 - 文件系统要求 ............................................................................................... ........................................................................................ - 385 - 文件系统 ................................................................................................. 表空间(tablespace)允许Database管理员使用多个文件系统来存储数据库对 象,从而可以决定如何更好的利用他们的物理储存设备。表空间的存在有具体的意义, 例如在访问频度不同的数据库对象上使用不同性能的磁盘,例如,将经常使用的表放在 高性能磁盘的文件系统上(例如SSD固态盘),而将其他表放在普通硬盘的文件系统上。 一个表空间,在GP集群中,对应的是一组分布式的操作系统目录,在每个Instance0 码力 | 416 页 | 6.08 MB | 1 年前3
 Pivotal Greenplum 最佳实践分享 查看实例宕机历史和恢复历史信息  select * from gp_configuration_history order by 1 ;  查看Tablespace对应的文件系统位置 select * from pg_filespace_entry ; Admin常用命令  gpstate:显示Greenplum数据库运行状态,详细配置等信息  常用可选参数 query_start,检查是否有3~6个小时以上的SQL仍在运行  检查空间使用情况 – gpssh -f allhosts =>df –h |grep data1,检查所有文件系统,包括xfs文件系统、tmp的使用情况; 日常巡检事项  检查操作系统日志 – gpssh检查所有节点的/var/log/message,grep过滤是否有硬件错误、系统错误等信息   确定是哪个实例的问题后,检查该节点是否有硬件故障 – 检查网络是否故障 – 检查实例的进程是否存在,ps –ef |grep postgres|grep port – 检查文件系统是否有异常(到相应实例对应的数据目录下,执行ls;echo“test‖ > mytest.txt看看是否有错误) 问题定位方法 现象-某个SQL任务执行时间太长0 码力 | 41 页 | 1.42 MB | 1 年前3 Pivotal Greenplum 最佳实践分享 查看实例宕机历史和恢复历史信息  select * from gp_configuration_history order by 1 ;  查看Tablespace对应的文件系统位置 select * from pg_filespace_entry ; Admin常用命令  gpstate:显示Greenplum数据库运行状态,详细配置等信息  常用可选参数 query_start,检查是否有3~6个小时以上的SQL仍在运行  检查空间使用情况 – gpssh -f allhosts =>df –h |grep data1,检查所有文件系统,包括xfs文件系统、tmp的使用情况; 日常巡检事项  检查操作系统日志 – gpssh检查所有节点的/var/log/message,grep过滤是否有硬件错误、系统错误等信息   确定是哪个实例的问题后,检查该节点是否有硬件故障 – 检查网络是否故障 – 检查实例的进程是否存在,ps –ef |grep postgres|grep port – 检查文件系统是否有异常(到相应实例对应的数据目录下,执行ls;echo“test‖ > mytest.txt看看是否有错误) 问题定位方法 现象-某个SQL任务执行时间太长0 码力 | 41 页 | 1.42 MB | 1 年前3
 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum云原生调度增强:针对云场景在线和离线业务混合部署场景,创新 CPU 调度算法保障在线业务对 CPU 的实时抢占及抖 动抑制,创新业务优先级 00M 内存回收算法保障在线业务安全可靠运行。 • 新文件系统 EulerFS:面向非易失性内存的新文件系统,采用软更新、目录双视图等技术减少文件元数据同步 时间,提升文件读写性能。 • 内存分级扩展 etMem:新增用户态 swap 功能,策略配置淘汰的冷内存交换到用户态存储,用户无感知,性能 Docker 容器交互,以在容器中执行用户定义函数 (UDF),这样方便数据科学家可以在不需要 DBA 帮助的情况自由使用数据分析,同时大大提高了安全性,Docker 容器确保用户代码无法访问源主机的文件系统。此外,容器启动时网络访问受限,无法连接回 Greenplum 数据库或 打开任何其他外部连接。 集成分析:改进后的全新分析接口 一直以来,客户都能在 Greenplum 中做高级0 码力 | 17 页 | 2.04 MB | 1 年前3 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum云原生调度增强:针对云场景在线和离线业务混合部署场景,创新 CPU 调度算法保障在线业务对 CPU 的实时抢占及抖 动抑制,创新业务优先级 00M 内存回收算法保障在线业务安全可靠运行。 • 新文件系统 EulerFS:面向非易失性内存的新文件系统,采用软更新、目录双视图等技术减少文件元数据同步 时间,提升文件读写性能。 • 内存分级扩展 etMem:新增用户态 swap 功能,策略配置淘汰的冷内存交换到用户态存储,用户无感知,性能 Docker 容器交互,以在容器中执行用户定义函数 (UDF),这样方便数据科学家可以在不需要 DBA 帮助的情况自由使用数据分析,同时大大提高了安全性,Docker 容器确保用户代码无法访问源主机的文件系统。此外,容器启动时网络访问受限,无法连接回 Greenplum 数据库或 打开任何其他外部连接。 集成分析:改进后的全新分析接口 一直以来,客户都能在 Greenplum 中做高级0 码力 | 17 页 | 2.04 MB | 1 年前3
 Greenplum 精粹文集SMP(对称多处理)架构难于扩展,并且在 CPU 计算和 IO 吞吐上不 能满足海量数据的计算需求。 分布式存储和分布式计算理论刚刚被提出来,Google 的两篇著名论文 发表后引起业界的关注,一篇是关于 GFS 分布式文件系统,另外一篇 是关于 MapReduce 并行计算框架的理论,分布式计算模式在互联网 行业特别是收索引擎和分词检索等方面获得了巨大成功。 Big Date2.indd 1 16-11-22 | t | f | r | c [ERROR]:- 17012 | 272379 | 121694359 | 1 | t | f | r | c 检查结果表明文件系统中存在部分数据文件在系统表中没有对应的 关系,也就是文件系统中有多余的数据文件。这种情况不会影响 Greenplum 集群的正常运作,可以暂时忽略不处理。 修 复 persistent table 表 的 问 题, 不 可 手0 码力 | 64 页 | 2.73 MB | 1 年前3 Greenplum 精粹文集SMP(对称多处理)架构难于扩展,并且在 CPU 计算和 IO 吞吐上不 能满足海量数据的计算需求。 分布式存储和分布式计算理论刚刚被提出来,Google 的两篇著名论文 发表后引起业界的关注,一篇是关于 GFS 分布式文件系统,另外一篇 是关于 MapReduce 并行计算框架的理论,分布式计算模式在互联网 行业特别是收索引擎和分词检索等方面获得了巨大成功。 Big Date2.indd 1 16-11-22 | t | f | r | c [ERROR]:- 17012 | 272379 | 121694359 | 1 | t | f | r | c 检查结果表明文件系统中存在部分数据文件在系统表中没有对应的 关系,也就是文件系统中有多余的数据文件。这种情况不会影响 Greenplum 集群的正常运作,可以暂时忽略不处理。 修 复 persistent table 表 的 问 题, 不 可 手0 码力 | 64 页 | 2.73 MB | 1 年前3
 Greenplum on Kubernetes
容器化MPP数据库Vertica Eon Mode ● 容器化数据库+Kubernetes ○ Apache Spark ○ CockroachDB ○ Apache HAWQ 云数据库存储方案 ● 块存储 ○ 文件系统接口 ● 对象存储 ○ 成本低 ○ 扩展性强 ○ 访问延迟高 Greenplum on Kubernetes Network Interconnect Standby Host Master0 码力 | 33 页 | 1.93 MB | 1 年前3 Greenplum on Kubernetes
容器化MPP数据库Vertica Eon Mode ● 容器化数据库+Kubernetes ○ Apache Spark ○ CockroachDB ○ Apache HAWQ 云数据库存储方案 ● 块存储 ○ 文件系统接口 ● 对象存储 ○ 成本低 ○ 扩展性强 ○ 访问延迟高 Greenplum on Kubernetes Network Interconnect Standby Host Master0 码力 | 33 页 | 1.93 MB | 1 年前3
 Greenplum数据库架构分析及5.x新功能分享高速数据导入和导出 – 主节点不是瓶颈 – 10+ TB/小时/Rack – 线性扩展 • 低延迟 – 加载后立刻可用 – 不需要中间存储 – 不需要额外数据处理 • 导入/导出 到&从: – 文件系统 – 任意 ETL 产品 – Hadoop 发行版 外部数据源 Interconnect ... ... ... ... 主节点 查询优化和调度 数据节点 存储数据 & 查询处 理0 码力 | 44 页 | 8.35 MB | 1 年前3 Greenplum数据库架构分析及5.x新功能分享高速数据导入和导出 – 主节点不是瓶颈 – 10+ TB/小时/Rack – 线性扩展 • 低延迟 – 加载后立刻可用 – 不需要中间存储 – 不需要额外数据处理 • 导入/导出 到&从: – 文件系统 – 任意 ETL 产品 – Hadoop 发行版 外部数据源 Interconnect ... ... ... ... 主节点 查询优化和调度 数据节点 存储数据 & 查询处 理0 码力 | 44 页 | 8.35 MB | 1 年前3
 VMware Greenplum v6.18 Documentationbreadth-first search (BFS) algorithm finds all nodes reachable from the source vertex by searching / traversing the graph in a breadth-first manner. The function is: graph_bfs( vertex_table,0 码力 | 1959 页 | 19.73 MB | 1 年前3 VMware Greenplum v6.18 Documentationbreadth-first search (BFS) algorithm finds all nodes reachable from the source vertex by searching / traversing the graph in a breadth-first manner. The function is: graph_bfs( vertex_table,0 码力 | 1959 页 | 19.73 MB | 1 年前3
 VMware Greenplum v6.19 Documentationbreadth-first search (BFS) algorithm finds all nodes reachable from the source vertex by searching / traversing the graph in a breadth-first manner. The function is: graph_bfs( vertex_table,0 码力 | 1972 页 | 20.05 MB | 1 年前3 VMware Greenplum v6.19 Documentationbreadth-first search (BFS) algorithm finds all nodes reachable from the source vertex by searching / traversing the graph in a breadth-first manner. The function is: graph_bfs( vertex_table,0 码力 | 1972 页 | 20.05 MB | 1 年前3
共 19 条
- 1
- 2













