线性减淡 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

大数据集成与Hadoop - IBM

度的可扩展性 • 线性数据可扩展性：硬件和软件系统通过线性增加硬件资源来线性提高处理吞吐量。例如，如果在50个处理器上运行4小时可以处理200GB数据，在100个处理器上运行4小时可以处理400GB数据，以此类推，则说明应用程序可以实现线性数据可扩展性。 • 应用程序纵向扩展：衡量软件在一个对称多处理器 (SMP) 系统中的多个处理器间实现线性数据可扩展性的有效程度。有效程度。 • 应用程序横向扩展：确定软件在非共享架构的多个 SMP 节点间实现线性数据可扩展性的有效程度。图1. 海量数据可扩展性是一项大数据集成的强制要求。在大数据时代，企业必须支持MPP群集系统才能实现扩展。支持海量数据可扩展性的需求并非只与Hadoop基础架构的出现有关。多年来，领先的数据仓库供应商（如IBM和Teradata）和领先的数据集成平台（如IBM ® InfoSphere 软件数据流通过简化在一个或多个节点实施和执行数据管道和数据分区的过程，从而充分利用非共享架构。软件数据流还可以将构建和优化多位用户运行的并行应用程序的复杂问题隐藏起来。利用数据分区实现线性数据可扩展性大数据集分散在多个独立节点间，单个作业对所有分区数据执行相同的应用程序逻辑。形成设计隔离的环境设计一个数据处理作业，并且无需重新设计和重新调整作业，即可在任何硬件配置中使用它。

0 码力 | 16 页 | 1.23 MB | 1 年前
3
Hadoop 概述

算资源进行排序、分区并在加载之前将数据转换成适配于 Oracle 的数据类型。当加载数据时，在 Hadoop 上进行的数据预处理降低了数据库 CPU 的使用率。这样就减少了对数据库应用程序的影响，减第 1 章 Hadoop 概述 15 轻了对资源的竞争，而这正是插入大量数据时的一个常见问题。它使得此连接器在连续且频繁地加载时尤其有用。 ORACLE 数据库 SQL

0 码力 | 17 页 | 583.90 KB | 1 年前
3

共 2 条前往

页

大数集成 Hadoop IBM 概述

分类

语言

格式

大数据集成与Hadoop - IBM

Hadoop 概述