尚硅谷大数据技术之Hadoop(入门)Distributed File System,简称 HDFS,是一个分布式文件系统。 HDFS架构概述 1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、 文件权限),以及每个文件的块列表和块所在的DataNode等。 2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。 3)Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份。 [root@hadoop100 ~]# useradd atguigu [root@hadoop100 ~]# passwd atguigu 4)配置 atguigu 用户具有 root 权限,方便后期加 sudo 执行 root 权限的命令 [root@hadoop100 ~]# vim /etc/sudoers 修改/etc/sudoers 文件,在%wheel 这行下面添加一行,如下所示: ## else echo $file does not exists! fi done done (b)修改脚本 xsync 具有执行权限 [atguigu@hadoop102 bin]$ chmod +x xsync (c)测试脚本 [atguigu@hadoop102 ~]$ xsync /home/atguigu/bin0 码力 | 35 页 | 1.70 MB | 1 年前3
Hadoop 概述的一个客户端改变集中式配置,便能改变分布式系 统的状态。 名称服务是将某个名称映射为与该名称相关信息的服务。它类 似于活动目录,作为一项名称服务,活动目录的作用是将某人的用 户 ID(用户名)映射为环境中的特定访问或权限。同样,DNS 服务作 为名称服务,将域名映射为 IP 地址。通过在分布式系统中使用 ZooKeeper,你能记录哪些服务器或服务正处于运行状态,并且能够 通过名称查看它们的状态。 如果有0 码力 | 17 页 | 583.90 KB | 1 年前3
Hadoop 迁移到阿里云MaxCompute 技术方案Spark MaxCompute 提供了 Spark on MaxCompute 的解决 方案,使 MaxCompute 提供的兼容开源的 Spark 计算 服务,让它在统一的计算资源和数据集权限体系之上,提 供 Spark 计算框架,支持用户以熟悉的开发使用方式提 交运行 Spark 作业。 * 支持原生多版本 Spark 作业:Spark1.x/Spark2.x 作业 都可运行;0 码力 | 59 页 | 4.33 MB | 1 年前3
共 3 条
- 1













