积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(10)Hadoop(10)

语言

全部中文(简体)(8)西班牙语(1)中文(繁体)(1)

格式

全部PDF文档 PDF(10)
 
本次搜索耗时 0.020 秒,为您找到相关结果约 10 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 中文(繁体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 這些年,我們一起追的Hadoop

    EE 領域有十多 年的講師教學經驗,熟悉 SOAP/RESTful Services、Design Patterns、EJB/JPA 等 Java EE 規 格,Struts/Spring/Hibernate 等 Open Source Framework,與 JBoss AS、 GlassFish 等 Application Server。 自認為會的技術不多,但是學不會的 也不多,最擅長把老闆交代的工作, 也不多,最擅長把老闆交代的工作, 以及找不到老師教的技術,想辦法變 成自己的專長。 目前負責 Java 與 .NET 雲端運算相 關技術的推廣,主要包括 Hadoop Platform 與 NoSQL 等 Big Data 相關 應用,Google App Engine、Microsoft Azure 與 CloudBees 等雲端平台的運 用,以及 Android、Windows Phone 等 Smart Phone 的應用程式開發。 Task 給 TT 3. TT 執行 Task 4. TT 向 JT 回報 Hadoop 1.x 架構 - MapReduce (MRv1) 只有一個 JobTracker (Master),可是要管理多個 TaskTracker (Slave)! 10 / 74 Hadoop 1.x 架構與限制 比較基本的模組: Hadoop HDFS (Storage) Hadoop MapReduce (Computing
    0 码力 | 74 页 | 45.76 MB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    的数据湖/数据仓库业务负载 ......................................................................... 15 3.2 不同的网络环境及部署形态迁移 .............................................................................................. MaxCompute 解决方案 11 2.2.1 MaxComptue 的逻辑架构 2.2.2 MaxCompute 产品特性 MaxCompute 提供了云原生、多租户的服务架构,在底层大规模计算、存储资源之上预先构建 好了 MaxCompute 计算服务、服务接口,提供了配套的安全管控手段和开发工具管理工具,产 品开箱即用。 功能 MaxCompute MaxCompute 支持大规模计算存储,适用于 TB 以上规 模的存储及计算需求,最大可达 EB 级别。同一个 MaxCompute 项目支持企业从创业团队发展到独角兽的 数据规模需求; 数据分布式存储,多副本冗余,数据存储对外仅开放表的 操作接口,不提供文件系统访问接口 自研数据存储结构,表数据列式存储,默认高度压缩,后 D k n e P y l w s o u ) ( ( f I w
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    并实现应用程序横向扩展以执行大数据集成,但这种说法显 然不真实。 没有非共享、大规模可扩展ETL引擎(如InfoSphere DataStage),企业势必会遇到功能和性能限制。越来越 多的企业意识到,不可扩展的ETL工具与MapReduce pushdown之争无法在Hadoop中提供所需的性能水平。 因此他们争相与IBM合作解决这个问题,因为IBM大数据集 成解决方案以其独有的方式支持大数据集成的大规模数据可 型ETL工作负载从RDBMS迁移至Hadoop将会节约巨额成 本。尽管如此,从RDBMS中的ETL手动编码环境迁移至ETL 和Hadoop的新手动编码环境只会使高昂的成本和冗长的供 货周期问题雪上加霜。 部署单一数据集成平台后,可通过以下功能为企业转型创造 机遇: • 一次构建作业,随时随地运行-无需修改,即可在企业中 的任何平台上运行该作业 • 访问、移动和加载数据-在企业内的各种来源和目标之间 • 用户不得不通过繁复的手动编码在Hadoop中运行较为 复杂的数据集成逻辑,或者限制流程在MapReduce中 运行相对简单的转换。 • MapReduce在处理大型数据集成工作负载方面具有多 种已知的性能限制,因为其目的在于牺牲高性能处理来 支持细粒度容错。 最佳实践4:在企业间实施世界级数据治理 绝大部分大型企业发现,在企业中建立数据治理机制即便是 可行的,也会十分困难。造成这种局面的原因很多。例如,企
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    Machine,VM)或笔记本电脑上完成初始配置,而且可以升级到服务 器部署。它具有高度的容错性,并且被设计为能够部署在低成本的 硬件之上。它提供对应用程序数据的高吞吐量访问,适合于面向大 型数据集的应用程序。 在任何环境中,硬件故障都是不可避免的。有了 HDFS,你的 数据可以跨越数千台服务器,而每台服务器上均包含一部分基础数 据。这就是容错功能发挥作用的地方。现实情况是,这么多服务器 总会遇到一台或者多台无法正常工作的风险。HDFS 。 HDP 能够帮助你通过使用虚拟机上的单节点群集来开始 Hadoop 之 旅,如图 1-4 所示。由于 Hadoop 是一个商用(几乎没有额外成本)的 解决方案,因此 HDP 使得你能够将其部署到云端或者自己的数据 中心。 HDP 为你提供数据平台基础以供搭建自己的 Hadoop 基础设 施,这包括一长串商业智能(BI)及其他相关供应商的列表。平台的 设计目标是支持处理多种来源及格式的数据,并且允许设计自定义
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 Hadoop开发指南

    1.2 ⾃⾏安装 ⾃⾏安装 针对部分存量已⾃⾏安装⽤⼾,可根据选择按照以下⽅式⾃⾏安装。 1.2.1 利⽤安装脚本部署 利⽤安装脚本部署 在任⼀master节点下的都有 /root/install\_uhadoop\_client.sh,⽤⼾可以利⽤此脚本进⾏客⼾端的安装部署 也可以通过外⽹下载最新版本安装脚本 Hadoop开发指南 Copyright © 2012-2021 UCloud
    0 码力 | 12 页 | 135.94 KB | 1 年前
    3
  • pdf文档 银河麒麟服务器操作系统V4 Hadoop 软件适配手册

    的威力进行高 速运算和存储。 Hadoop 实现了一个分布式文件系统(Hadoop Distributed File System),简称 HDFS。HDFS 有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件 上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有 着超大数据集(large data set)的应用程序。HDFS 放宽了(relax)POSIX HDFS 架构原理 HDFS 是 Hadoop 分布式文件系统(Hadoop Distributed File System)的缩写, 为分布式计算存储提供了底层支持。采用 Java 语言开发,可以部署在多种普通的 廉价机器上,以集群处理数量积达到大型主机处理性能。 银河麒麟服务器操作系统 V4 hadoop 软件适配手册 3 HDFS 采用 master/slave 架构。一个 任务的计算结果可以合并在 一起来计算最终的结果。简而言之,Hadoop Mapreduce 是一个易于编程并且能在 大型集群(上千节点)快速地并行得处理大量数据的软件框架,以可靠,容错的 方式部署在商用机器上。MapReduce 这个术语来自两个基本的数据转换操作:map 过程和 reduce 过程。  map: map 操作会将集合中的元素从一种形式转化成另一种形式,在这种情况下,
    0 码力 | 8 页 | 313.35 KB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    Hadoop 在兼容性,安 全性,稳定性上有所增强。Cloudera 的标价为每年每个节点 10000 美元。 (4)Cloudera Manager 是集群的软件分发及管理监控平台,可以在几个小时内部署好一 个 Hadoop 集群,并对集群的节点及服务进行实时监控。 3)Hortonworks Hadoop 官网地址:https://hortonworks.com/products/data-center/hdp/ 访问过计算机的公钥(public key) id_rsa 生成的私钥 id_rsa.pub 生成的公钥 authorized_keys 存放授权过的无密登录服务器公钥 3.2.4 集群配置 1)集群部署规划 注意: ➢ NameNode 和 SecondaryNameNode 不要安装在同一台服务器 ➢ ResourceManager 也很消耗内存,不要和 NameNode、SecondaryNameNode
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    3)测试结果分析:为什么读取文件速度大于网络带宽?由于目前只有三台服务器,且有三 个副本,数据读取就近原则,相当于都是读取的本地磁盘数据,没有走网络。 第 3 章 HDFS—多目录 3.1 NameNode 多目录配置 1)NameNode 的本地目录可以配置成多个,且每个目录存放内容相同,增加了可靠性 2)具体配置如下 (1)在 hdfs-site.xml 文件中添加如下内容 drwxrwxr-x. 3 atguigu atguigu 4096 12 月 11 08:03 name2 检查 name1 和 name2 里面的内容,发现一模一样。 3.2 DataNode 多目录配置 1)DataNode 可以配置成多个目录,每个目录存储的数据不一样(数据不是副本) 2)具体配置如下 在 hdfs-site.xml 文件中添加如下内容 3]$ hadoop fs -put /opt/module/hadoop-3.1.3/LICENSE.txt / 思考:如果数据不均衡(hadoop105 数据少,其他节点数据多),怎么处理? 4.3 服务器间数据均衡 1)企业经验: 在企业开发中,如果经常在 hadoop102 和 hadoop104 上提交任务,且副本数为 2,由于
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 大数据时代的Intel之Hadoop

    0.9.0 交互式数据仓库 Sqoop 1.4.1 关系数据ETL工具 Flume 1.1.0 日志收集工具 Intel Hadoop Manager 2.2 安装、部署、配置、监控、告警和访问控制 Zookeeper 3.4.4 分布式协作服务 Pig 0.9.2 数据流处理语言 Mahout 0.6 数据挖掘 HBase 0.94.1
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 Hadoop 3.0以及未来

    对象存储 - HDFS-7240 • 更高性能的Namenode:更高效的内存使用,锁的改进等 • Erasure Coding的完善 YARN的未来 • 更大规模的集群支持 • 更好的资源调度,隔离和多租户 • 支持更多的应用,包括long running的service 谢谢 Q&A
    0 码力 | 33 页 | 841.56 KB | 1 年前
    3
共 10 条
  • 1
前往
页
相关搜索词
這些我們一起Hadoop迁移阿里MaxCompute技术方案大数集成IBM概述开发指南银河麒麟服务务器服务器操作系统操作系统V4软件适配手册硅谷入门生产调优时代Intel3.0以及未来
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩