尚硅谷大数据技术之Hadoop(生产调优手册)测试网速:来到 hadoop102 的/opt/module 目录,创建一个 [atguigu@hadoop102 software]$ python -m SimpleHTTPServer 2.1 测试 HDFS 写性能 0)写测试底层原理 1)测试内容:向 HDFS 集群写 10 个 128M 的文件 [atguigu@hadoop102 mapreduce]$ hadoop 容器最小核数 yarn.scheduler.maximum-allocation-vcores 容器最大核数 2)参数具体使用案例 详见《尚硅谷大数据技术之 Hadoop(Yarn)》,第 2.1 节。 9.2 容量调度器使用 详见《尚硅谷大数据技术之 Hadoop(Yarn)》,第 2.2 节。 9.3 公平调度器使用 详见《尚硅谷大数据技术之 Hadoop(Yarn)》,第 nodemanager.vmem-check-enabledfalse Ratio between virtual memory to physical memory when setting memory 0 码力 | 41 页 | 2.32 MB | 1 年前3
银河麒麟服务器操作系统V4 Hadoop 软件适配手册............................................................................................. 4 2.1 解压 HADOOP 软件 ..................................................................................... Task,同样也运行与某一个 Slave 节点的 Container 中。RM, NM,AM 乃至普通的 Container 之间的通信,都是用 RPC 机制。 2 Hadoop 软件适配 2.1 解压 hadoop 软件 $ tar -xvf hadoop-2.7.7.tar.gz -C /usr/local/ $ cd /usr/local/hadoop-2.7.7/etc/hadoop/0 码力 | 8 页 | 313.35 KB | 1 年前3
Hadoop 迁移到阿里云MaxCompute 技术方案............................................................................................. 7 2.1 Hadoop 及开源生态与阿里云大数据生态对比 ......................................................................... 据生态,快速完成数据和业务的迁移以及生态系统的对接。 Alibaba Cloud MaxCompute 解决方案 7 2 阿里云大数据与开源生态对比 2.1 Hadoop 及开源生态与阿里云大数据生态对比 2.1.1 主流大数据体系架构 Hadoop 及开源生态由一系列的开源组件共同组成,很多用户基于 Hadoop 及开源生态组件构 建企业数0 码力 | 59 页 | 4.33 MB | 1 年前3
尚硅谷大数据技术之Hadoop(入门)Tomcat 收集访 问日志 Tomcat 收集访 问日志 Tomcat 推荐业务 分析结果数据库 分析结果文件 Flink 第 2 章 Hadoop 运行环境搭建(开发重点) 2.1 模板虚拟机环境准备 0)安装模板虚拟机,IP 地址 192.168.10.100、主机名称 hadoop100、内存 4G、硬盘 50G 尚硅谷大数据技术之 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网 7)单点启动 8)配置 ssh 9)群起并测试集群 3.2.1 虚拟机准备 详见 2.1、2.2 两节。 3.2.2 编写集群分发脚本 xsync 1)scp(secure copy)安全拷贝 (1)scp 定义 scp 可以实现服务器与服务器之间的数据拷贝。(from0 码力 | 35 页 | 1.70 MB | 1 年前3
Spark 简介以及与 Hadoop 的对比方式,通过记录跟踪所有生成 RDD 的转换(transformations)也就是记录每 个 RDD 的 lineage(血统)来重新计算生成丢失的分区数据。 2 Spark 与 Hadoop 对比 2.1 快速 Spark 的中间数据放到内存中,对于迭代运算效率更高。Spark 更适合于迭代运算比较多 的 ML 和 DM 运算。因为在 Spark 里面,有 RDD 的抽象概念。 2.20 码力 | 3 页 | 172.14 KB | 1 年前3
Hadoop开发指南source /etc/profile或者 source ~/.bashrc 2. HDFS HDFS是⼀个⾼度容错性和⾼吞吐量的分布式⽂件系统。它被设计的易于扩展也易于使⽤,适合海量⽂件的存储。 2.1 HDFS基础操作 基础操作 查询⽂件 Usage: hadoop fs [generic options] -ls [-d] [-h] [-R] [] 上传⽂件 Usage: hadoop 0 码力 | 12 页 | 135.94 KB | 1 年前3
共 6 条
- 1













