积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(10)Hadoop(10)

语言

全部中文(简体)(8)西班牙语(1)中文(繁体)(1)

格式

全部PDF文档 PDF(10)
 
本次搜索耗时 0.021 秒,为您找到相关结果约 10 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 中文(繁体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 大数据集成与Hadoop - IBM

    通过部署全面的数据治理计划,您可以构建环境来帮助确保 所有Hadoop数据具有出色的品质、安全可靠且适合使用目 的。这可以帮助企业用户回答以下问题: • 我理解这些数据的内容和意义吗? • 我能衡量这些信息的质量吗? • 报告中的数据来自何处? • 这对Hadoop内部数据有着怎样的影响? • 数据在抵达Hadoop数据湖之前存储在哪里? 最佳实践5:在企业间实施强大的管理和操作控制 合格的 客户展开合作,定制一个财务解决方案来满足您的业务目标,实 现有效的现金管理,以及改善您的总体拥有成本。IBM Global Financing是您进行关键IT投资和向前推进您业务的最智慧 选择。有关更多信息,请访问:ibm.com/financing © 版权所有IBM Corporation 2014 国际商业机器中国有限公司 北京市朝阳区北四环中路27号 盘古大观写字楼
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 大数据时代的Intel之Hadoop

    PB)数据, 2015 年150亿部接入设备 大数据时代的数据 2011年每天处理的数据超 过: 24 PB 2011年6月乊前, Facebook平台每天分享资 料: 40亿 智慧城市数据 中国某一线城市: 200PB/季度 中国一线城市健康档案数 据: 5.5 million 传统的数据处理技术 大数据时代的数据 速度 数据量 多样化 传统数据
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 這些年,我們一起追的Hadoop

    HDFS and RDBMS Hadoop Ecosystem 30 / 74 HCatalog Hadoop 裡頭的 Naming Service 讓各種不同技術,不需要知道資料真實存放的位置,也能夠很方便 地存取資料 31 / 74 Yahoo! 做出了 Pig,把 PigLatin 翻成一堆 MapReduce Job Facebook 做出了 Hive,把 HiveQL 翻成一堆 MapReduce Microsoft Dryad,是 Stinger Initiative 的一部分 Dataflow model on a directed acyclic graph (DAG) of nodes 能夠 讓 Query Plan 更簡單、更有效率 48 / 74 UC Berkeley AMPLab 2009 年的研究計畫,2010 年 Open Source,由 DataBricks 負責 架在 data systems. 53 / 74 Google 2010 年發表了 Dremel 研究論文,是一個具有 Interactive Analysis of Web- Scale Datasets 能力的系統 Apache Drill 是 Dremel 的 Open Source 版本,號稱可以 Scale Out 到 10,000+ 的 Node,處 理 PB 等級的資料,秒殺 Trillion
    0 码力 | 74 页 | 45.76 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    资源管理器 数据节点 数据节点 数据节点 节点管理器 节点管理器 节点管理器 图 1-1 MapReduce 的功能使得它成为最常用的批处理工具之一。该处 理器的灵活性使其能利用自身的影响力来挑战现有系统。通过将数 据处理的工作负载分为多个并行执行的任务,MapReduce 允许其用 户处理存储于 HDFS 上不限数量的任意类型的数据。因此,MapReduce 让 Hadoop 似于活动目录,作为一项名称服务,活动目录的作用是将某人的用 户 ID(用户名)映射为环境中的特定访问或权限。同样,DNS 服务作 为名称服务,将域名映射为 IP 地址。通过在分布式系统中使用 ZooKeeper,你能记录哪些服务器或服务正处于运行状态,并且能够 通过名称查看它们的状态。 如果有节点出现问题导致宕机,ZooKeeper 会采用一种通过选 举 leader 来完成自动故障切换的策略,这是它自身已经支持的解决 来源。充分理解 Hadoop 平台能够使其用户实时处理大量可扩展的 数据,并提供最优分析。Hadoop 存储流程的突出优点在于没有额外 的存储或计算开销,而是存在收益,比如提高数据的准确性并且能 够对其进行分析。第 2 章将详细讨论 Hadoop 存储的各个方面。
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    项目。支持主流 BI 及 SQL 客户端工具的 连接访问,如 Tableau、帆软 BI、Navicat、SQL Workbench/J 等。 显著提升的查询性能:提升了一定数据规模下的查询性 能,查询结果秒级可见,支持 BI 分析、Ad-hoc、在线服 务等场景。 Alibaba Cloud MaxCompute 解决方案 14 Spark MaxCompute Spark 6.4 Meta 和数据迁移 6.4.1 环境准备 6.4.1.1 工具运行环境 ⚫ JDK 1.8 ⚫ Python 3.x ⚫ Hive Client ⚫ 能访问 Hive Server 的机器 ⚫ 网络连接 MaxCompute Alibaba Cloud MaxCompute 解决方案 31 https://help.aliyun
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 Hadoop 3.0以及未来

    MapReduce  Task层次的Native优化 MapReduce Task层次Native优化 • 对map output collector的Native实现,对于shuffle密集型的task能 带来30%的性能提升。 Hadoop 的未来 HDFS的未来 • 对象存储 - HDFS-7240 • 更高性能的Namenode:更高效的内存使用,锁的改进等 • Erasure Coding的完善
    0 码力 | 33 页 | 841.56 KB | 1 年前
    3
  • pdf文档 Spark 简介以及与 Hadoop 的对比

    算法实现的分布式计算,拥有 Hadoop MapReduce 所具有的 优点;但不同于 MapReduce 的是 Job 中间输出和结果可以保存在内存中,从而不再需要读 写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 map reduce 的算 法。 1.2 Spark 核心概念 1.2.1 弹性分布数据集(RDD) RDD 是 Spark 的最基本抽象,是
    0 码力 | 3 页 | 172.14 KB | 1 年前
    3
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    图 2. 利用表函数进行并行处理 由于表函数可以并行运行,Hadoop 流作业也可以不同程度地并行运行,并且后者不受 Oracle 查询协调器的控制,这种情况下,队列能提供负载平衡。 4 Oracle 白皮书 — 通过 Oracle 并行处理集成 Hadoop 数据 利用表函数的示例 下面我们将以一个实际示例展示图
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    ————————————————————————————— 更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网 3.2.11 集群时间同步 如果服务器在公网环境(能连接外网),可以不采用集群时间同步,因为服务器会定期 和公网时间进行校准; 如果服务器在内网环境,必须要配置集群时间同步,否则时间久了,会产生时间偏差, 导致集群执行任务时间不同步。 1)需求
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    第 1 章 HDFS—核心参数 1.1 NameNode 内存生产配置 1)NameNode 内存计算 每个文件块大概占用 150byte,一台服务器 128G 内存为例,能存储多少文件块呢? 128 * 1024 * 1024 * 1024 / 150Byte ≈ 9.1 亿 G MB KB Byte 2)Hadoop2.x 系列,配置 NameNode
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
共 10 条
  • 1
前往
页
相关搜索词
大数集成HadoopIBM时代Intel這些我們一起概述迁移阿里MaxCompute技术方案3.0以及未来Spark简介对比通过Oracle并行处理并行处理数据硅谷入门生产调优手册
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩