Apache Kyuubi 1.7.2 Documentation
5.26 MB
405 页
0 评论
| 语言 | 格式 | 评分 |
|---|---|---|
英语 | .epub | 3 |
| 摘要 | ||
Apache Kyuubi 1.7.2 Documentation 描述了 Kyuubi 的安装、配置、日志、构建、调试及开发工具等内容。文档详细说明了 Kyuubi 的架构,包括 Kyuubi 服务器、引擎以及它们在分布式 SQL 查询中的作用。同时,涵盖了高可用性、多租户隔离、高效的查询优化技术,如自动合并小文件、优化倾斜连接以及阶段级配置隔离。文档还介绍了与外部系统(如 Apache ZooKeeper、Apache Curator)的集成,以及对 Apache Spark、Iceberg、Delta Lake 等多种数据源的支持。 | ||
| AI总结 | ||
《Apache Kyuubi 1.7.2 Documentation》主要内容总结如下:
### 1. 安装指南
文档提供了基于二进制包和源码包的安装指南。解压后的目录结构包括:
- `LICENSE`:Apache授权协议。
- `NOTICE`:项目声明及依赖信息。
- `bin`:Kyuubi服务器的启动脚本。
- `conf`:配置文件目录。
- `jars`:Kyuubi服务器所需的包。
- `logs`:服务器日志存储位置。
- `pid`:存储服务器实例的PID文件。
- `work`:子进程(SQL引擎)的工作目录。
支持通过Docker和Helm进行部署,并提供了相应的配置文件。
### 2. 功能架构
Kyuubi采用分离架构,分为**服务器(Server)**和**引擎(Engine)**两部分。服务器负责处理客户端请求,引擎负责执行SQL查询。其核心特点包括:
- 支持多种计算框架(如Apache Spark、Flink、Doris等)和数据源(如Hive、Iceberg、Delta Lake)。
- 提供服务多租户隔离和高可用性(HA)支持。
- 基于Zookeeper实现服务发现和分布式协调。
- 支持通过SQL进行统一数据湖和仓库的访问,具备身份认证和授权功能。
### 3. 适应性查询执行 (AQE) 优化
Kyuubi基于Spark的AQE框架提供以下优化功能:
1. **合并小文件**:通过额外的shuffle操作解决小文件问题。
2. **优化偏斜连接**:增加shuffle节点确保偏斜连接优化生效。
3. **阶段级配置隔离**:支持不同阶段的并行度配置,优化数据处理效率。
### 4. 日志与监控
Kyuubi使用Log4j2进行日志管理,日志分为:
- **服务器日志**:记录服务器启动/停止和客户端请求响应。
- **引擎日志**:记录SQL引擎运行信息。
- **操作日志**:记录会话和操作事件。
日志默认存储于 `$KYUUBI_HOME/logs`,支持自定义日志配置文件。
### 5. 高可用性与多租户
部署在高可用模式下时,Kyuubi通过Zookeeper实现服务协调。此外,Kyuubi支持端到端的多租户隔离,确保资源和数据的安全共享。
### 6. 数据湖与仓库访问
支持通过统一的SQL接口访问DataLake和Lakehouse资源,支持以下格式:
- **Apache Iceberg**:高性能表格式。
- **Delta Lake**:支持事务和版本控制的存储层。
### 7. 配置与优化
Kyuubi支持多种配置参数,包括:
- **线程池配置**:如执行线程池大小、等待队列大小。
- **批处理配置**:如任务检查间隔、超时阈值。
- **日志配置**:如日志路径、格式化方式。
### 总结
Kyuubi 1.7.2作为一个分布式SQL网关,支持多种计算引擎和数据源,具有高可用性、多租户和强大的优化能力,适用于DataLake和Lakehouse场景。其架构清晰,功能全面,并为用户提供了灵活的配置和监控选项。 | ||
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
398 页请下载阅读 -
文档评分














Apache Kyuubi 1.7.2 Documentation