2.1 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

尚硅谷大数据技术之Hadoop（生产调优手册）

测试网速：来到 hadoop102 的/opt/module 目录，创建一个 [atguigu@hadoop102 software]$ python -m SimpleHTTPServer 2.1 测试 HDFS 写性能 0）写测试底层原理 1）测试内容：向 HDFS 集群写 10 个 128M 的文件 [atguigu@hadoop102 mapreduce]$ hadoop 容器最小核数 yarn.scheduler.maximum-allocation-vcores 容器最大核数 2）参数具体使用案例详见《尚硅谷大数据技术之 Hadoop（Yarn）》，第 2.1 节。 9.2 容量调度器使用详见《尚硅谷大数据技术之 Hadoop（Yarn）》，第 2.2 节。 9.3 公平调度器使用详见《尚硅谷大数据技术之 Hadoop（Yarn）》，第 nodemanager.vmem-check-enabled false Ratio between virtual memory to physical memory when setting memory

0 码力 | 41 页 | 2.32 MB | 1 年前
3
银河麒麟服务器操作系统V4 Hadoop 软件适配手册

............................................................................................. 4 2.1 解压 HADOOP 软件 ..................................................................................... Task，同样也运行与某一个 Slave 节点的 Container 中。RM， NM，AM 乃至普通的 Container 之间的通信，都是用 RPC 机制。 2 Hadoop 软件适配 2.1 解压 hadoop 软件 $ tar -xvf hadoop-2.7.7.tar.gz -C /usr/local/ $ cd /usr/local/hadoop-2.7.7/etc/hadoop/

0 码力 | 8 页 | 313.35 KB | 1 年前
3
Hadoop 迁移到阿里云MaxCompute 技术方案

............................................................................................. 7 2.1 Hadoop 及开源生态与阿里云大数据生态对比 ......................................................................... 据生态，快速完成数据和业务的迁移以及生态系统的对接。 Alibaba Cloud MaxCompute 解决方案 7 2 阿里云大数据与开源生态对比 2.1 Hadoop 及开源生态与阿里云大数据生态对比 2.1.1 主流大数据体系架构 Hadoop 及开源生态由一系列的开源组件共同组成，很多用户基于 Hadoop 及开源生态组件构建企业数

0 码力 | 59 页 | 4.33 MB | 1 年前
3
尚硅谷大数据技术之Hadoop（入门）

Tomcat 收集访问日志 Tomcat 收集访问日志 Tomcat 推荐业务分析结果数据库分析结果文件 Flink 第 2 章 Hadoop 运行环境搭建（开发重点） 2.1 模板虚拟机环境准备 0）安装模板虚拟机，IP 地址 192.168.10.100、主机名称 hadoop100、内存 4G、硬盘 50G 尚硅谷大数据技术之 Java –大数据 –前端 –python 人工智能资料下载，可百度访问：尚硅谷官网 7）单点启动 8）配置 ssh 9）群起并测试集群 3.2.1 虚拟机准备详见 2.1、2.2 两节。 3.2.2 编写集群分发脚本 xsync 1）scp（secure copy）安全拷贝（1）scp 定义 scp 可以实现服务器与服务器之间的数据拷贝。（from

0 码力 | 35 页 | 1.70 MB | 1 年前
3
Spark 简介以及与 Hadoop 的对比

方式，通过记录跟踪所有生成 RDD 的转换（transformations）也就是记录每个 RDD 的 lineage（血统）来重新计算生成丢失的分区数据。 2 Spark 与 Hadoop 对比 2.1 快速 Spark 的中间数据放到内存中，对于迭代运算效率更高。Spark 更适合于迭代运算比较多的 ML 和 DM 运算。因为在 Spark 里面，有 RDD 的抽象概念。 2.2

0 码力 | 3 页 | 172.14 KB | 1 年前
3
Hadoop开发指南

source /etc/profile或者 source ~/.bashrc 2. HDFS HDFS是⼀个⾼度容错性和⾼吞吐量的分布式⽂件系统。它被设计的易于扩展也易于使⽤，适合海量⽂件的存储。 2.1 HDFS基础操作基础操作查询⽂件 Usage: hadoop fs [generic options] -ls [-d] [-h] [-R] [] 上传⽂件 Usage: hadoop

0 码力 | 12 页 | 135.94 KB | 1 年前
3

共 6 条前往

页

硅谷大数技术 Hadoop 生产调优手册银河麒麟服务务器服务器操作系统操作系统 V4 软件适配迁移阿里 MaxCompute 方案入门 Spark 简介以及对比开发指南

分类

语言

格式

尚硅谷大数据技术之Hadoop（生产调优手册）

银河麒麟服务器操作系统V4 Hadoop 软件适配手册

Hadoop 迁移到阿里云MaxCompute 技术方案

尚硅谷大数据技术之Hadoop（入门）

Spark 简介以及与 Hadoop 的对比

Hadoop开发指南