积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(9)Hadoop(9)

语言

全部中文(简体)(8)西班牙语(1)

格式

全部PDF文档 PDF(9)
 
本次搜索耗时 0.017 秒,为您找到相关结果约 9 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    HADOOP_NAMENODE_OPTS=-Xmx3072m 3)Hadoop3.x 系列,配置 NameNode 内存 (1)hadoop-env.sh 中描述 Hadoop 的内存是动态分配的 # The maximum amount of heap to use (Java -Xmx). If no unit # is provided, it will be converted 人工智能资料下载,可百度访问:尚硅谷官网 4.2 服役新服务器 1)需求 随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据 的需求,需要在原有集群基础上动态添加新的数据节点。 2)环境准备 (1)在 hadoop100 主机上再克隆一台 hadoop105 主机 (2)修改 IP 地址和主机名称 [root@hadoop105 ~]# vim 相关 yarn.resourcemanager.scheduler.client.thread-count ResourceManager 处理调度 器请求的线程数量 yarn.resourcemanager.scheduler.class 配置调度器 (2)Nodemanager 相关 yarn.nodemanager.resource.memory-mb
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    。 主节点 客户端 HDFS 分布式数据存储 YARN 分布式数据处理 从属 NAMENODE 活动 NAMENODE 备用 NAMENODE 调度器 共享编辑日志 或者 JOURNAL NODE 从节点 容器 容器 容器 资源管理器 数据节点 数据节点 数据节点 节点管理器 节点管理器 节点管理器 图 1-1 有多少资源。它运行了多种服务,其中最重要的是用于决定如何分 配资源的资源调度器。节点管理器(每个群集中有多个)是此基础设 施的从节点。当开始运行时,它向资源管理器声明自己。此类节点 有能力向群集提供资源,它的资源容量即内存和其他资源的数量。 在运行时,资源调度器将决定如何使用该容量。Hadoop 2 中的 YARN 框架允许工作负载在各种处理框架之间动态共享群集资源,这些框 架包括 MapReduce、Impala
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    阿里自研分布式存储服务,类似 HDFS。MaxCompute 对外目前只暴露表接口,不能直接访问文件系统。 Alibaba Cloud MaxCompute 解决方案 15 资源调度 Fuxi 阿里自研的资源调度系统,类似 Yarn。 数据上传下载 Tunnel 不暴露文件系统,通过 Tunnel 进行批量数据上传下载。 流式接入 Datahub MaxCompute 配套的流式数据接入服务,粗略地类似 统一的命令行工具和 JAVA/PYTHON SDK 开发&诊断 Dataworks/Studio/Logview 配套的数据同步、作业开发、工作流编排调度、作业运维 及诊断工具。开源社区常见的 Sqoop、Kettle、Ozzie 等 实现数据同步和调度。 整体 不是孤立的功能,完整的企 业服务 不需要多组件集成、调优、定制,开箱即用。 3 MaxCompute 迁移场景分析 3 迁移基于 Hadoop 的数据湖/数据仓库业务负载 根据 MaxCompute 产品的定位和特性,您可以将基于 Hadoop 为核心的数据湖、数据仓库及 周边配套工具(数据集成、数据开发、作业调度、数据治理等)业务负载迁移至 MaxCompute 及 Dataworks 的云原生大数据平台解决方案。 工作负载 Hadoop 开源生态 MaxCompute 产品组件/MaxCompute
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    MapReduce(计算) HDFS(数据存储) Yarn(资源调度) Common(辅助工具) MapReduce (计算+资源调度) HDFS(数据存储) Common(辅助工具) Hadoop1.x组成 Hadoop2.x组成 在 Hadoop1.x 时 代 , Hadoop中的MapReduce同 时处理业务逻辑运算和资 源的调度,耦合性较大。 在Hadoop2.x时代,增 加了Yarn。Yarn只负责 Spark Streaming 实时计算 Spark Sql 数据查询 Oozie任务调度 Azkaban任务调度 业务模型、数据可视化、业务应用 Z o o k e e p e r 数 据 平 台 配 置 和 调 度 数据来源层 数据传输层 数据存储层 资源管理层 数据计算层 任务调度层 业务模型层 Storm实时计算 Flink 图中涉及的技术名词解释如下: 上存储的大数 据进行计算。 5)Flink:Flink 是当前最流行的开源大数据内存计算框架。用于实时计算的场景较多。 6)Oozie:Oozie 是一个管理 Hadoop 作业(job)的工作流程调度管理系统。 7)Hbase:HBase 是一个分布式的、面向列的开源数据库。HBase 不同于一般的关系数据库, 它是一个适合于非结构化数据存储的数据库。 8)Hive:Hive 是基于 Hadoop
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 Hadoop 3.0以及未来

    Hortonworks创立 Hadoop 1.0发布 Hadoop 2.0 GA Spark成为顶级顷目 Hadoop 3.0 2017 Hadoop生态系统 文件存储层 HDFS 资源/任务调度 YARN 计算引擎MapReduce 计算引擎Spark NoSQL HBase 数据仓 库SQL 机器/深 度学习 Batch 任务 流处理 搜索 … Kafka Hadoop 3介绍 Common • HDFS • YARN  YARN Timeline Service v.2  YARN Federation  劢态资源配置  容器资源的劢态调整  资源隔离  调度的增强  YARN的Web页面的增强 • MapReduce YARN Timeline Service v.2 • 扩展性 分布式读写 读写分离 HBase存储 YARN Timeline 允许运行时劢态的调整分配给容器的资源 资源隔离 • 磁盘资源的隔离- YARN-2619 • 网络IO的隔离- YARN-2140 • Docker Container- YARN-3611 调度的增强 • 在同一个队列(queue)的优先级- YARN-1963 YARN的Web页面的增强 • YARN-3368 Hadoop 3介绍 • Common • HDFS • YARN
    0 码力 | 33 页 | 841.56 KB | 1 年前
    3
  • pdf文档 银河麒麟服务器操作系统V4 Hadoop 软件适配手册

    提供了一套基础设计来处理大多数困难的工作以保证任务可以成功 执行,比如 Hadoop 决定如果将提交的 job 分解为多个独立的 map 和 reduce 任务 (task)来执行,它就会对这些 task 进行调度并为其分配合适的资源,决定将某 个 task 分配到集群中哪个位置(如果可能,通常是这个 task 所要处理的数据所在 的位置,这样可以最小化网络开销)。Hadoop 会监控每一个 task 确保其成功完 理 框 架 中 , resourcemanager 为 master,nodemanager 是 slave。Resourcemanager 负责对各个 nademanger 上资源进行统一管理和调度。当用户提交一个应用程序时,需要提供 一个用以跟踪和管理这个程序的 ApplicationMaster,它负责向 ResourceManager 申请资源,并要求 NodeManger 启动可以占用一定资源的 nager、 ApplicationMaster 和 Container 等几个组件构成。 ResourceManager 是 Master 上一个独立运行的进程,负责集群统一的资源管 理、调度、分配等等;NodeManager 是 Slave 上一个独立运行的进程,负责上报 节点的状态;App Master 和 Container 是运行在 Slave 上的组件,Container 是
    0 码力 | 8 页 | 313.35 KB | 1 年前
    3
  • pdf文档 MATLAB与Spark/Hadoop相集成:实现大数据的处理和价值挖

    MDCS 10 Hadoop Hadoop是跨计算机集群的分布式大数据处理平台,由两部分组成: • YARN (Yet Another Resource Negotiator) – 资源调度模型,实现数据跨节点的最小移动 • Map/Reduce – 跨节点分布式计算模型 • HDFS (Hadoop Distributed File System) - 跨节点的分布式文件系统 Hadoop
    0 码力 | 17 页 | 1.64 MB | 1 年前
    3
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    Hadoop的进程 (mapper) 启动之后,作业监控器进程将监视启动程序脚本。一旦mapper 完成 Hadoop 集群中数据的处理之后,bash 脚本即完成,如图 4 所示。 作业监控器将监视数据库调度程序队列,并在 shell 脚本完成时发出通知(第 7 步)。作业监 控器检查数据队列中的剩余数据元素(第 8 步)。只要队列中存在数据,表函数调用就会继 续处理数据(第 6 步)。 6
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    使整体性能和有效性降低一个数量级乃至更多。 Hadoop Yet Another Resource Negotiator(YARN) 纳入了MapReduce的资源管理功能,并将它们内置其 中,这样需要在Hadoop群集间动态执行的其他应用即可 使用它们。结果是,这种方法可将大规模可扩展数据集成 引擎作为本机 Hadoop应用程序来实现,而且不会影响 MapReduce的性能。希望在Hadoop上实现可扩展性和 运行数据集成工作负载的场景可能包括: • 并行RDBMS • 不含RDBMS或Hadoop的网格 • Hadoop(包含或不含MapReduce pushdown)中 • Hadoop环境内外之间,在一端抽取数据卷,动态处理 和转换记录,然后在另一端加载记录 为了实现成功和可持续发展并保持较低的成本,一项有效的 大数据集成解决方案必须灵活支持上述各种场景。根据 IBM 与大数据客户的合作经验,InfoSphere
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
共 9 条
  • 1
前往
页
相关搜索词
硅谷大数技术Hadoop生产调优手册概述迁移阿里MaxCompute方案入门3.0以及未来银河麒麟服务务器服务器操作系统操作系统V4软件适配MATLABSpark集成实现数据处理价值通过Oracle并行并行处理IBM
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩