大数据时代的Intel之Hadoop关系数据ETL工具 Flume 1.1.0 日志收集工具 Intel Hadoop Manager 2.2 安装、部署、配置、监控、告警和访问控制 Zookeeper 3.4.4 分布式协作服务 Pig 0.9.2 数据流处理语言 Mahout 0.6 数据挖掘 HBase 0.94.1 实时、分布式、高维数据库 Map/Reduce 1.0.3 分布式计算框架0 码力 | 36 页 | 2.50 MB | 1 年前3
大数据集成与Hadoop - IBM建议步骤: • 查找:利用条款、标记和集合来查找接受治理和监管的 数据源 • 监管:为相关资产添加标记、条款和自定义属性 • 收集:通过收集来捕获资产,并开展具体的分析或治理 工作 • 协作:共享其他内容管理和治理集合 • 治理:创建并引用信息治理策略和规则;应用数据质 量、屏蔽、归档和清除操作 • 卸载:单击HDFS来复制数据并执行分析,以便强化仓库 • 分析:分析已卸载的数据0 码力 | 16 页 | 1.23 MB | 1 年前3
共 2 条
- 1













