积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(10)Hadoop(10)

语言

全部中文(简体)(8)西班牙语(1)中文(繁体)(1)

格式

全部PDF文档 PDF(10)
 
本次搜索耗时 0.016 秒,为您找到相关结果约 10 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 中文(繁体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    xml 文件中添加如下内容 dfs.namenode.name.dir file://${hadoop.tmp.dir}/dfs/name1,file://${hadoop.tmp. dir}/dfs/name2 注意:因为每台服务器节点的磁盘情况不同,所以这个配置配完之后,可以选择不分发 xml 文件中添加如下内容 dfs.datanode.data.dir file://${hadoop.tmp.dir}/dfs/data1,file://${hadoop.tmp. dir}/dfs/data2 3)查看结果 [atguigu@hadoop102 ec Usage: bin/hdfs ec [COMMAND] [-listPolicies] [-addPolicies -policyFile <file>] [-getPolicy -path ] [-removePolicy -policy ] [-setPolicy
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    7)2005 年Hadoop 作为 Lucene的子项目 Nutch的一部分正式引入Apache基金会。 8)2006 年 3 月份,Map-Reduce和Nutch Distributed File System (NDFS)分别被纳入到 Hadoop 项目 中,Hadoop就此正式诞生,标志着大数据时代来临。 9)名字来源于Doug Cutting儿子的玩具大象 Hadoop的logo 加了Yarn。Yarn只负责 资 源 的 调 度 , MapReduce 只负 责 运算 。 Hadoop3.x在组成上没 有变化。 1.5.1 HDFS 架构概述 Hadoop Distributed File System,简称 HDFS,是一个分布式文件系统。 HDFS架构概述 1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、 文件权限), 遍历所有目录,挨个发送 for file in $@ do #4. 判断文件是否存在 if [ -e $file ] then #5. 获取父目录 pdir=$(cd -P $(dirname $file); pwd)
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    查询中完全透明地使用。 因此,可以考虑用外部表从 Oracle 数据库中直接访问 HDFS(Hadoop 文件系统)中存储的 数据。遗憾的是,常规的操作系统无法调用外部表驱动直接访问 HDFS 文件。FUSE(File System in Userspace)项目针对这种情况提供了解决方法。有多种 FUSE 驱动程序支持用户挂 载 HDFS 存储,并将其作为常规文件系统处理。通过使用一个此类驱动程序,并在数据库实 to oe; grant execute on dbms_aq to oe; connect oe/oe -- Simple reader package to read a file containing two numbers CREATE OR REPLACE PACKAGE hdfs_reader IS -- Return type of pl/sql also contains the code to insert into -- the table in Figure 3 step 1 FUNCTION read_from_hdfs_file(pcur IN SYS_REFCURSOR, in_directory IN VARCHAR2) RETURN return_rows_t PIPELINED PARALLEL_ENABLE(PARTITION
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    .. ] } 7.2.3 单表/单分区迁移 在运行 hive sql 进行数据迁移的时候,我们提供了两种模式,input_all 模式与 input_single_file 模式。 Alibaba Cloud MaxCompute 解决方案 55 在 input_all 模式下,我们给一个 meta-processor 生成的目录,之后 odps_hive_udtf_runner processed/ 在 input_single_file 模式下,我们给一个 hive sql 文件路径, odps_hive_udtf_runner 会从该文件中读取 hive sql 并执行。例如: python3 odps-data-carrier/bin/hive_udtf_sql_runner.py --input_single_file processed/test/hive_ udtf_sql/single_partition/test_0.sql input_single_file 模式可以帮助我们熟悉工具,并且在数据量大的场景下可以控 制迁移的进度。 8 最佳实践 8.1 【 场 景 1 】 Hive 数 据 和 Oozie 工 作 流 任 务 如 何 迁 移 到 MaxCompute 和 Dataworks? 8.1.1 网络环境检查
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    个开源软件项目, 支持在多个商业服务器群集间分散处理和存储大型数据集, 并可根据需求变化从单一服务器扩展到数以千计的服务器。主 要的Hadoop组件包括Hadoop Distributed File System (用于存储大型文件)和Hadoop分布式并行处理框架(称为 MapReduce)。 但是,Hadoop基础架构本身并没有提供完整的大数据集成解 决方案,摆在人们面前的既有挑战,也有机遇,只有处理好这些 贵。您应该能够构建一次作业,然后即可在三个环境中的任意 一个环境内运行它。 最适合Hadoop的流程 Hadoop 平台由以下两个主要组件构成:分布式容错文件系统 (称为Hadoop Distributed File System (HDFS))和并 行处理框架(称为MapReduce)。 HDFS平台十分适合处理大型顺序操作,其中的数据读取“切 片”通常为64MB或128MB。通常情况下,除非应用程序加载 MapReduce架构而担忧。 InfoSphere DataStage可直接在Hadoop节点上运行, 而不必像一些供应商实施计划要求的那样在单独的配置节 点上运行。在与IBM General Parallel File System (GPFS™)-FPO搭配使用时,该功能有助于降低网络流量, 这样即可在Hadoop环境中提供符合POSIX要求的存储子 系统。POSIX文件系统允许ETL作业直接访问Hadoop中存
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 银河麒麟服务器操作系统V4 Hadoop 软件适配手册

    基金会所开发的分布式系统基础架构。用户可以在 不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高 速运算和存储。 Hadoop 实现了一个分布式文件系统(Hadoop Distributed File System),简称 HDFS。HDFS 有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件 上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有 为海量的数 据提供了存储,而 MapReduce 则为海量的数据提供了计算。 1.4 HDFS 架构原理 HDFS 是 Hadoop 分布式文件系统(Hadoop Distributed File System)的缩写, 为分布式计算存储提供了底层支持。采用 Java 语言开发,可以部署在多种普通的 廉价机器上,以集群处理数量积达到大型主机处理性能。 银河麒麟服务器操作系统 V4 hadoop
    0 码力 | 8 页 | 313.35 KB | 1 年前
    3
  • pdf文档 這些年,我們一起追的Hadoop

    Batch 的小象了! 26 / 74 Hadoop 家族 27 / 74 Windows 家族 28 / 74 Hadoop 動物園 29 / 74 HDFS:Distributed File System MapReduce:Distributed Data Analysis Engine Avro:Language-Neutral Data Serialization System Hive 改造計畫 34 / 74 Hive 改造成果 - Speed 35 / 74 Hive 改造成果 - Scale 支援 ORCFile (Optimized Row Columnar File),提供優異的壓縮比) 以 ORCFile 存放的資料一樣可以透過 HCatalog 存取,所以 Pig 或 MapReduce 都可以無縫接軌 36 / 74 Hive 改造成果 - SQL
    0 码力 | 74 页 | 45.76 MB | 1 年前
    3
  • pdf文档 MATLAB与Spark/Hadoop相集成:实现大数据的处理和价值挖

    Resource Negotiator) – 资源调度模型,实现数据跨节点的最小移动 • Map/Reduce – 跨节点分布式计算模型 • HDFS (Hadoop Distributed File System) - 跨节点的分布式文件系统 Hadoop Ecosystem 11 Spark Spark是一个流行的开源集群计算框架 • 并行计算引擎 • 使用广义的计算模型 •
    0 码力 | 17 页 | 1.64 MB | 1 年前
    3
  • pdf文档 Hadoop开发指南

    currently being written: 11) Total blocks (validated): 69916 (avg. block size 6517260 B) (Total open file blocks (not validated): 10) Minimally replicated blocks: 69916 (100.0 %) Over-replicated blocks:
    0 码力 | 12 页 | 135.94 KB | 1 年前
    3
  • pdf文档 Hadoop 概述

    Hadoop 分布式文件系统(HDFS) 在 Hadoop Common 安装完成后,是时候该研究 Hadoop Stack 的其余组件了。HDFS(Hadoop Distributed File System)提供一个分布 式文件系统,设计目标是能够运行在基础硬件组件之上。大多数企 业被其最小化的系统配置要求所吸引。此环境可以在虚拟机(Virtual Hadoop 大数据解决方案
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
共 10 条
  • 1
前往
页
相关搜索词
硅谷大数技术Hadoop生产调优手册入门通过Oracle并行处理并行处理集成数据迁移阿里MaxCompute方案IBM银河麒麟服务务器服务器操作系统操作系统V4软件适配這些我們一起MATLABSpark实现价值开发指南概述
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩