积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(5)Hadoop(5)

语言

全部中文(简体)(4)中文(繁体)(1)

格式

全部PDF文档 PDF(5)
 
本次搜索耗时 0.012 秒,为您找到相关结果约 5 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 中文(繁体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 大数据集成与Hadoop - IBM

    片”通常为64MB或128MB。通常情况下,除非应用程序加载 数据来管理相关任务,否则不会对HDFS文件进行分区或排 序。即使应用程序可以对生成的数据切片进行分区和排序, 也无法保证数据切片在HDFS系统中的位置正确。这意味着, 无法在该环境中有效管理数据搭配工作。数据搭配(Data collocation)至关重要,因为它可确保将联接(join)键相同的 数据整合到相同的节点,因此该流程不仅性能高,而且很准确。 系统。POSIX文件系统允许ETL作业直接访问Hadoop中存 储的数据,而无需使用HDFS接口。该环境支持将ETL工作 负载迁移到运行Hadoop的硬件环境,从而帮助将处理工 作移到数据存储位置,并充分利用Hadoop和ETL处理 硬件。 资源管理系统(如IBM Platform™ Symphony)还可用 于管理Hadoop环境内外的数据集成工作负载。 这意味着,虽然InfoSphere 结了5个基础大数据集成最佳实践。这5个原则体现了成功实 施大数据集成措施的最佳方法: 1. 避免出于任何目的在任何位置进行手动编码 2. 整个企业采用一个数据集成和治理平台 3. 可在需要运行海量可扩展数据集成的任何位置提供该功能 4. 在企业间实施世界级数据治理 5. 在企业间实施强大的管理和操作控制 最佳实践1:避免出于任何目的在任何位置进行手动编码 在过去的二十年中,大型企业认识到使用商业数据集成工具 替换手动
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 银河麒麟服务器操作系统V4 Hadoop 软件适配手册

    分解为多个独立的 map 和 reduce 任务 (task)来执行,它就会对这些 task 进行调度并为其分配合适的资源,决定将某 个 task 分配到集群中哪个位置(如果可能,通常是这个 task 所要处理的数据所在 的位置,这样可以最小化网络开销)。Hadoop 会监控每一个 task 确保其成功完 银河麒麟服务器操作系统 V4 hadoop 软件适配手册 4 成,并重启一些失败的 2.7.7/hdfs/data 银河麒麟服务器操作系统 V4 hadoop 软件适配手册 6 datanode 上数据块的物理存储位置 dfs.replication 1
    0 码力 | 8 页 | 313.35 KB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认 配置值时,才需要修改自定义配置文件,更改相应属性值。 (1)默认配置文件: 要获取的默认文件 文件存放在 Hadoop 的 jar 包中的位置 [core-default.xml] hadoop-common-3.1.3.jar/core-default.xml [hdfs-default.xml] hadoop-hdfs-3 [atguigu@hadoop102 ~]$ hadoop fs -put /opt/software/jdk-8u212- linux-x64.tar.gz / (2)上传文件后查看文件存放在什么位置 ➢ 查看 HDFS 文件存储路径 [atguigu@hadoop102 subdir0]$ pwd /opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1436128598-
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 這些年,我們一起追的Hadoop

    HDFS and RDBMS Hadoop Ecosystem 30 / 74 HCatalog Hadoop 裡頭的 Naming Service 讓各種不同技術,不需要知道資料真實存放的位置,也能夠很方便 地存取資料 31 / 74 Yahoo! 做出了 Pig,把 PigLatin 翻成一堆 MapReduce Job Facebook 做出了 Hive,把 HiveQL 翻成一堆
    0 码力 | 74 页 | 45.76 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    源管理器和节点管理器。让我们来勾勒 YARN 的框架。首先考虑一 个两层的群集,其中资源管理器在顶层(每个群集中只有一个)。资 Hadoop 大数据解决方案 6 源管理器是主节点。它了解从节点所在的位置(较底层)以及它们拥 有多少资源。它运行了多种服务,其中最重要的是用于决定如何分 配资源的资源调度器。节点管理器(每个群集中有多个)是此基础设 施的从节点。当开始运行时,它向资源管理器声明自己。此类节点
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
共 5 条
  • 1
前往
页
相关搜索词
大数集成HadoopIBM银河麒麟服务务器服务器操作系统操作系统V4软件适配手册硅谷技术入门這些我們一起概述
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩