Greenplum Database 管理员指南 6.2.1....................................................................................... - 267 - 容量评估................................................................................................... Instance 需要对应数个 CPU Core 的资源 资源,具体的比例需要根据数据库的适用场景进行综合评估。例如在生产环境,每个 Instance 所在的主机配置了 2 个 16 Core 的 CPU,可根据不同的场景,配置 4 ~ 12 个不等的 Primary,这个数字的选择需要由富有经验的专业技术支持人员进行评估, 每个 Instance 所在主机配置的 Primary 越多,响应并发的能力越弱,但单个任务的 如下图所示,这是一种混合配对镜像模式,将一群数量为偶数的机器,分为两组, 每台机器的镜像分散在对面组的机器上。关于如何选择镜像模式,以及如何分散镜像关 系,可以根据用户的实际需求进行评估和实施。 目前,编者的一键式集群配置安装初始化命令已经内置了两种镜像模式,分别为 RING 和 PAIR。RING 是一种带有环状关系的镜像模式,典型的特征是,一组机器形成 对等的环,环上的每台机器,其对应的0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 精粹文集4~6 个 Primary Instance( 生产经验值 )。 Big Date2.indd 40 16-11-22 下午3:38 Greenplum 精粹文集 41 接下来,评估一下外部表加载数据的性能: 1) 一个 gpfdist 服务只使用一个 CPU 核的资源。 因此,通常,一个 gpfdist 服务每秒可以处理约 400MB~450MB 的 TXT 文本,如果是 性能不足,可以增加 gpfdist 数量;如果 节点数量成为瓶颈,可以增加外部表加载的并发度或者增加 Primary Instance 数量。 如果不是主流硬件环境,对于瓶颈的分析,请参照上述标准评估。通常, 40 个左右的 Primary Instance 处理性能匹配一个 gpfdist 服务的处理 性能,上了万兆网卡,网络就永远不会成为加载时的瓶颈,磁盘一般 也不会成为加载时的瓶颈。有兴趣的可以去看看 与 width 两个指标, 这两个指标的乘积表示执行计划对每个 Primary Instance 上此节点数 据尺寸的评估,单位为字节。我们假设集群中 PrimaryInstance 的数 量为 N,缺省情况下,执行规划器使用 N 作为 Primary Instance 数量 来评估选择广播还是重分布。 Big Date2.indd 43 16-11-22 下午3:38 44 有一个参0 码力 | 64 页 | 2.73 MB | 1 年前3
Greenplum机器学习⼯具集和案例● 移动应⽤用 API 分析 ● 使⽤用Madlib进⾏行行聚 类分析,建⽴立会话 识别模型和主题模 型 ● 建⽴立scoring pipeline, 对新访问 的安全性进⾏行行评估 ● 使⽤用可视化⼯工具对 结果进⾏行行更更好地呈 现 背景 2017.thegiac.com 数据源 • 数据 - API 访问⽇日志0 码力 | 58 页 | 1.97 MB | 1 年前3
完全兼容欧拉开源操作系统的 HTAP 数据平台 GreenplumEmbedded,镜像大小<5M,启动时间<5S。 4. 繁荣社区生态 友好卓面环境:UKUDDEXfce 卓面环境,丰富社区卓面环境生态。 • 欧拉 DevKit:支持操作系统迁移、兼容性评估、简化安全配置 secPaver 等更多开发工具。 Greenplum:新一代 HTAP 数据平台 Greenplum 自 2006 年发布第一个版本以来,就以精巧架构、简单易用、运行稳定、优异性能、环境适应性强在0 码力 | 17 页 | 2.04 MB | 1 年前3
共 4 条
- 1













