Hadoop 概述Hadoop 的主要贡献者之一。这便开启了在多种数据库资源上使 用 Hadoop 的大门。 应用* 源 *请向供应商确认。资源可能会有所不同。 HADOOP 数据访问 YARN 数据管理 开发和数据工具* 数据系统* 治理与集成 安全操作 操作工具* 基础设施* 图 1-4 HDP 被视为一个生态系统,因为它创造了一个数据社区,将 第 1 章 图 1-6 这并不意味着 Hadoop 或者其他数据平台的解决方案无法在非 Windows 环境下运行。你应该细心检查现有的或者计划使用的环境 以决定最优解决方案。数据平台或者数据管理平台正如其名。它是 一个集中式计算系统,用于收集、集成和管理大型结构化和非结构 化数据集。 从理论上讲,无论 HortonWorks,还是 Cloudera,均是可供选 择的平台,包括用于与现有数据环境和 连接器协 同 Hortonworks,优化了 Hadoop 上的整条大数据供应链,将数据转 换为具有可操作性的信息来驱动商业价值。 例如,现代的数据架构正在越来越多地用于建造大型数据湖。 通过将数据管理服务集成为更大的数据湖,企业可以利用各种各样 的渠道来存储和处理大量数据,这些渠道包括社交媒体、点击流数 据、服务器日志、客户交易与交互、视频以及来自现场设备的传感 器数据。 Hortonworks0 码力 | 17 页 | 583.90 KB | 1 年前3
Docker 从入门到实践 0.4启动 ii. 守护态运行 iii. 终止 iv. 进入容器 v. 导出和导入 vi. 删除 7. 仓库 i. Docker Hub ii. 私有仓库 iii. 配置文件 8. 数据管理 i. 数据卷 ii. 数据卷容器 iii. 备份、恢复、迁移数据卷 9. 使用网络 i. 外部访问容器 ii. 容器互联 10. 高级网络配置 i. 快速配置指南 ii. 配置 Dockerfile 的介绍; 重新校订中英文混排格式。 修订文字表达。 发布繁体版本分支:zh-Hant。 0.2: 2014-09-18 对照官方文档重写介绍、基本概念、安装、镜像、容器、仓库、数据管理、网络等章节; 添加底层实现章节; 添加命令查询和资源链接章节; 其它修正。 0.1: 2014-09-05 添加基本内容; 修正错别字和表达不通顺的地方。 本书源码在 Github 内部以及容器之间管理数据,在容器中管理数据主要有两种方式: 数据卷(Data volumes) 数据卷容器(Data volume containers) Docker 数据管理 Docker —— 从入门到实践 46 数据管理 数据卷是一个可供一个或多个容器使用的特殊目录,它绕过 UFS,可以提供很多有用的特性: 数据卷可以在容器之间共享和重用 对数据卷的修改会立马生效 对数据卷的更新,不会影响镜像0 码力 | 179 页 | 2.27 MB | 1 年前3
大数据集成与Hadoop - IBM数据转换相对简单,因为无法使用ETL工具将较为复杂 的逻辑推送到RDBMS。 • 数据质量受到影响。 • 关键任务(如数据剖析)无法实现自动化-在很多情况下 根本无法执行。 • 未实施有效的数据治理(数据管理、数据沿袭、影响分 析),因而响应法规要求变得更加困难且非常昂贵,对 关键业务数据的信心更无从谈起。 相反,采用海量可扩展数据集成平台来优化大数据集成工作 负载的企业,则可最大限度降低潜在的负面影响,更有效地通 均可实现这些工作 • 支持各种数据集成范式,包括批量处理、联盟、更改数 据捕获、为数据集成任务启用SOA、与事务完整性实时 集成和/或企业用户自助数据集成 另外,还可以建立世界级的数据治理工作,包括数据管理、数 据沿袭和跨工具影响分析。 最佳实践3:可在需要运行海量可扩展数据集成的任何位置提 供该功能 Hadoop能以极低的成本对数据集成工作负载实施大规模 分布式处理。但是,客户需要的是海量可扩展数据集成解决方0 码力 | 16 页 | 1.23 MB | 1 年前3
Docker 从入门到实践 0.9.0(2017-12-31)Dockerfile 多阶段构建 其它制作镜像的方式 实现原理 操作容器 启动 守护态运行 终止 进入容器 导出和导入 删除 访问仓库 Docker Hub 私有仓库 私有仓库高级配置 数据管理 数据卷 监听主机目录 使用网络 外部访问容器 容器互联 配置 DNS 高级网络配置 快速配置指南 容器访问控制 端口映射实现 配置 docker0 网桥 3 1.12.5 Docker 初学者,也希望可供理解原理和实现的高级用户 参考。同时,书中给出的实践案例,可供在进行实际部署时借鉴。前六章为基础内容,供用 户理解 Docker 的基本概念和操作;7 ~ 9 章介绍包括数据管理、网络等高级操作;第 10 ~ 13 章介绍了容器生态中的几个核心项目;14、15 章讨论了关于 Docker 安全和实现技术等高级 话题。后续章节则分别介绍包括 Etcd、CoreOS、Ku Dockerfile 的介绍 重新校订中英文混排格式 修订文字表达 发布繁体版本分支:zh-Hant 0.2.0: 2014-09-18 对照官方文档重写介绍、基本概念、安装、镜像、容器、仓库、数据管理、网络等 章节 添加底层实现章节 添加命令查询和资源链接章节 其它修正 0.1.0: 2014-09-05 添加基本内容 修正错别字和表达不通顺的地方 修订记录 12 如何贡献项目0 码力 | 370 页 | 6.73 MB | 1 年前3
《TensorFlow 2项目进阶实战》1-基础理论篇:TensorFlow 2设计思想• API 完全兼容原生 Keras • 支持保存和加载 TensorFlow SavedModel • 支持 Eager Execution • 支持分布式训练 tf.data:功能强大的数据管理模块 支持多种数据处理 图像解码 Shuffle py_function 重采样 支持多种数据格式 图像文件 文本文件 CSV 文件 NumPy 数组 Python 生成器 TFRecord0 码力 | 40 页 | 9.01 MB | 1 年前3
金融级云原生 PaaS 探索与实践Pod伸缩管理 集群伸缩管理 变更管控 配额管理 运维原子操作 精细化调度 接入层流程调拨 应用层流量调拨 跨集群状态 分发/汇聚 数据层流量调拨 压测/灰度 流量管理 单元化 元数据管理 弹性流量管理 跨集群发布策略 多集群管理 跨集群网络 跨集群镜像管理 蓝绿发布 灰度分组发布 中间件变配 (DRM/Scheduler/Message) Mesh流调拨和治理 弹性建站/下站0 码力 | 20 页 | 1.71 MB | 6 月前3
Kubernetes for Edge Computing across
Inter-Continental Haier Production Sites面向业务管理 弹性伸缩 API Gateway 负载均衡 应用编排 日志监控 告警 服务发现 API 业务中台 多租户管理 运维中台 云端操作系统 数据中台 面向数据与智能 数据管理 大数据 机器学习 资源管理 深度学习 AI工具 API IOT中台 面向行业解 决方案 边缘计算 数据通道 数据分析 API 海尔工业互联网 - 微服务之框架支持 Netflix0 码力 | 33 页 | 4.41 MB | 1 年前3
1.3 MOSN 在云原生的探索及实践MOSN 作为 Envoy 动态 so, 提升编译速度 • 增强 Envoy 扩展能力,复用 MOSN 现有的 filter 能力 • 同时具备云原生 xDS 、 REST API服务元数据管理 通道能力 • 复用 Envoy 高效网络通道,如为 Dapr 能力提供底层 gRPC 通道 • 具备硬件加速集成能力 • 内存管理 Zero Copy • MOSN/GoLang 和 Envoy0 码力 | 36 页 | 35.61 MB | 1 年前3
01. MOSN 高性能网络扩展实践 - 王发康MOSN 作为 Envoy 动态 so,提 升编译速度 • 增强 Envoy 扩展能力,复用 MOSN 现有的 filter 能力 • 同时具备云原生 xDS 、REST API服务元数据管理通道能力 • 复用 Envoy 高效网络通道,如为 Dapr 能力提供底层 gRPC 通道 • 具备硬件加速集成能力 • 内存管理 Zero Copy • MOSN/GoLang 和 Envoy0 码力 | 29 页 | 2.80 MB | 1 年前3
Ozone:Hadoop 原生分布式对象存储Ozone:Hadoop 原生分布式对象存储 Spark大数据博客 - https://www.iteblog.com 构架 Ozone 从结构上分为三个部分,Ozone Manager, 元数据管理;Storage Container Manager, 数据块和节点管理;Datanode, 数据最终的存放处。类比 HDFS 的构架, 可以看到原来 Namenode 的功能,现在由 Ozone0 码力 | 10 页 | 1.24 MB | 1 年前3
共 12 条
- 1
- 2













