积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(8)Hadoop(8)

语言

全部中文(简体)(8)

格式

全部PDF文档 PDF(8)
 
本次搜索耗时 0.017 秒,为您找到相关结果约 8 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 大数据时代的Intel之Hadoop

    数据库虚拟大表功能,实现 HBase 数据库复制和备仹功能, 等等。 提供底层 Hadoop 性能优化算法和稳定性增强 •基亍 Hadoop 底层的大量优化算法,配合英特尔优化架构,使应用效率更高、计算存储分布更均衡,系统安装程序计算得出的优化参数配置,适合大多数 应用情冴,不硬件技术相结合,提高平台性能 提供企业必须的管理和监控功能 •提供独有的基亍浏览器的集群安装和管理界面, Intel Hadoop研发团队 • 行业应用 英特尔®中国云计算创新中心 数据中心: • 11 个机柜,其中网络机柜1个,服务 器机柜10个 • 电气容量:6 kW/机柜 • 配电:一路220V AC 市电 + 一路 240V DC 直流 • 况源采用况冶水系统,末端采用行间 送风 • 封闭热走廊 Intel Hadoop研发团队 推劢产业应用
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    ————————— 更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网 尚硅谷大数据技术之 Hadoop(生产调优手 册) (作者:尚硅谷大数据研发部) 版本:V3.3 第 1 章 HDFS—核心参数 1.1 NameNode 内存生产配置 1)NameNode 内存计算 每个文件块大概占用 150byte,一台服务器 集群间数据拷贝 尚硅谷大数据技术 之集群迁移(Apache和CDH).doc 第 8 章 MapReduce 生产经验 8.1 MapReduce 跑的慢的原因 MapReduce 程序效率的瓶颈在于两点: 1)计算机性能 CPU、内存、磁盘、网络 2)I/O 操作优化 (1)数据倾斜 (2)Map 运行时间太长,导致 Reduce 等待过久 (3)小文件过多
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    地址:深圳市南山区高新南一道德赛科技大厦8层0801-0803单元 邮编:518057 电话:(86.755) 8660-7100 传真:(86.755) 2167-1299 甲骨文亚洲研发中心-上海 地址:上海市杨浦区淞沪路290号创智天地10号楼512-516单元 邮编:200433 电话:(86.21) 6095-2500 传真:(86.21) 6095-2555
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    ————————————————————————————— 更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网 尚硅谷大数据技术之 Hadoop(入门) (作者:尚硅谷大数据研发部) 版本:V3.3 第 1 章 Hadoop 概述 1.1 Hadoop 是什么 Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 Hadoop 3.0以及未来

    XOR编码: 1,0 需要额外的1位 HDFS纠错码(Erasure Coding) • Reed-Solomon (RS) 编码 数据可靠性和存储效率 • 数据可靠性:可以最多几个节点故障 • 存储效率:k/(k+m) 可靠性 存储效率 单副本 0 100% 3副本 2 33% XOR(6个数据单元) 1 86% RS(6,3) 3 67% RS(10,4) 4 71% 存储布局-连续和条状
    0 码力 | 33 页 | 841.56 KB | 1 年前
    3
  • pdf文档 Spark 简介以及与 Hadoop 的对比

    RDD 数据集的操作之后的结果,都可以存放到 内存中,下一个操作可以直接从内存中输入,省去了 MapReduce 大量的磁盘 IO 操作。这对 于迭代运算比较常见的机器学习算法, 交互式数据挖掘来说,效率提升比较大。 1.2.2 RDD 的转换与操作 对于 RDD 可以有两种计算方式:转换(返回值还是一个 RDD)与操作(返回值不是一个 RDD) 1. 转换(Transformations) 记录每 个 RDD 的 lineage(血统)来重新计算生成丢失的分区数据。 2 Spark 与 Hadoop 对比 2.1 快速 Spark 的中间数据放到内存中,对于迭代运算效率更高。Spark 更适合于迭代运算比较多 的 ML 和 DM 运算。因为在 Spark 里面,有 RDD 的抽象概念。 2.2 灵活 1. Spark 提供的数据集操作类型有很多种,不像
    0 码力 | 3 页 | 172.14 KB | 1 年前
    3
  • pdf文档 Hadoop 概述

    或者加载数据到文本文件或者基于文本文件的 Hive 表中。分区也可 以在从 Hive 分区表中查询或加载时被删减。 另一种 Oracle 解决方案 Oracle Loader for Hadoop 是一种高性能 且高效率的连接器,用于从 Hadoop 中加载数据到 Oracle 数据库。 当 Hadoop 发起数据传送时,Oracle Loader for Hadoop 将数据推送到 数据库中。如图 1-9 所示。Oracle 之相关的组件,均能得到直接收益。它推翻了以前认为只有依靠数 据挖掘工具才能实现的界限,使你能够以一种截然不同的方式来查 看数据。Hadoop 并不能替代组织查看数据的方式,却能显著提高其 查看数据的效率。Hadoop 排除了各种局限性,并且正在各个新领域 中继续发展。 理解 Hadoop 的存储系统将使你能够利用数据集成和业务分析 来汇总大型数据湖并分析各种数据类型,而且不依赖于它们的当前
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    节点间,单个作业对所有 分区数据执行相同的应用 程序逻辑。 形成设计隔离的环境 设计一个数据处理作业, 并且无需重新设计和重新 调整作业,即可在任何硬 件配置中使用它。 使用它。这些功能对于通过提升效率来降低成本至关重要。没 有它们,该平台将无法处理大量的大数据。 InfoSphere Information Server数据集成产品组合 支持4大海量数据可扩展性架构特征。请在Forrester报 选择并行RDBMS、Hadoop和可扩展的ETL网格来运行大数据 集成工作负载。但无论选择哪种方法,信息基础架构都必须满足 一个常见的要求:全面支持大规模可扩展处理。 某些数据集成操作在RDBMS引擎内外的运行效率较高。同样, 并非所有数据集成操作均适用于Hadoop环境。设计精妙的架 构必须足够灵活,可以充分利用系统中每个环境的优势(参见 图3)。 在ETL网格中运行 在数据库中运行 在Hadoop中运行
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
共 8 条
  • 1
前往
页
相关搜索词
大数时代IntelHadoop硅谷技术生产调优手册通过Oracle并行处理并行处理集成数据入门3.0以及未来Spark简介对比概述IBM
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩