银河麒麟服务器操作系统V4 Hadoop 软件适配手册............................................................................................. 7 3.1 格式化 NAMENODE ..................................................................................... 2.2.7 配置 slaves $ vim slaves 内容如下: Kylin 3 格式化并启动集群 3.1 格式化 namenode $ cd /usr/local/hadoop-2.7.7/ $ bin/hdfs namenode -format 3.2 启动 namenode 和 datanode0 码力 | 8 页 | 313.35 KB | 1 年前3
Hadoop 迁移到阿里云MaxCompute 技术方案............................................................................................ 15 3.1 迁移基于 Hadoop 的数据湖/数据仓库业务负载 ....................................................................... Sqoop、Kettle、Ozzie 等 实现数据同步和调度。 整体 不是孤立的功能,完整的企 业服务 不需要多组件集成、调优、定制,开箱即用。 3 MaxCompute 迁移场景分析 3.1 迁移基于 Hadoop 的数据湖/数据仓库业务负载 根据 MaxCompute 产品的定位和特性,您可以将基于 Hadoop 为核心的数据湖、数据仓库及 周边配套工具(数据集成、数据开发、作业调度、数据治理等)业务负载迁移至0 码力 | 59 页 | 4.33 MB | 1 年前3
尚硅谷大数据技术之Hadoop(入门)\etc 路径 hosts 文件 2.3 在 hadoop102 安装 JDK 1)卸载现有 JDK 注意:安装 JDK 前,一定确保提前删除了虚拟机自带的 JDK。详细步骤见问文档 3.1 节 中卸载 JDK 步骤。 2)用 XShell 传输工具将 JDK 导入到 opt 目录下面的 software 文件夹下面 尚硅谷大数据技术之 伪分布式模式:也是单机运行,但是具备 Hadoop 集群的所有功能,一台服务器模 拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。 ➢ 完全分布式模式:多台服务器组成分布式环境。生产环境使用。 3.1 本地运行模式(官方 WordCount) 1)创建在 hadoop-3.1.3 文件下面创建一个 wcinput 文件夹 [atguigu@hadoop102 hadoop-3.1.3]$0 码力 | 35 页 | 1.70 MB | 1 年前3
尚硅谷大数据技术之Hadoop(生产调优手册)3)测试结果分析:为什么读取文件速度大于网络带宽?由于目前只有三台服务器,且有三 个副本,数据读取就近原则,相当于都是读取的本地磁盘数据,没有走网络。 第 3 章 HDFS—多目录 3.1 NameNode 多目录配置 1)NameNode 的本地目录可以配置成多个,且每个目录存放内容相同,增加了可靠性 2)具体配置如下 (1)在 hdfs-site.xml 文件中添加如下内容0 码力 | 41 页 | 2.32 MB | 1 年前3
共 4 条
- 1













