 百度智能云 Apache Doris 文档,SMALLINT,INT,BIGINT,LARGEINT,DOUBLE,DATE或者 DATETIME类型。 示例: HLL 数据类型 HLL 数据类型 HLL(HyperLogLog) 类型是一个二进制类型。HLL 类型只能用于聚合类型的表(Aggregation Table),并且必须指定聚合类型为 HLL_UNION。 HLL 类型主要用于非精确快速去重场景下,对数据进行预聚合。 HLL列只能通过配套的 HLL列只能通过配套的 hll_union_agg、hll_cardinality、hll_hash 进行查询或使用。 BITMAP 数据类型 BITMAP 数据类型 BITMAP 类型是一个二进制类型。BITMAP 类型只能用于聚合类型的表(Aggregation Table),并且必须指定聚合类型为 BITMAP_UNION。 BITMAP 类型主要用于精确去重场景下,对数据进行预聚合。同 中查询数据并导入。 Example Example 1. 向 表中导入一行数据 其中第一条、第二条语句是一样的效果。在不指定目标列时,使用表中的列顺序来作为默认的目标列。 第三条、第四条语句表达的意思是一样的,使用 列的默认值,来完成数据导入。 2. 向 表中一次性导入多行数据 其中第一条、第二条语句效果一样,向 表中一次性导入两条数据 第三条、第四条语句效果已知,使用 列的默认值向 表中导入两条数据0 码力 | 203 页 | 1.75 MB | 1 年前3 百度智能云 Apache Doris 文档,SMALLINT,INT,BIGINT,LARGEINT,DOUBLE,DATE或者 DATETIME类型。 示例: HLL 数据类型 HLL 数据类型 HLL(HyperLogLog) 类型是一个二进制类型。HLL 类型只能用于聚合类型的表(Aggregation Table),并且必须指定聚合类型为 HLL_UNION。 HLL 类型主要用于非精确快速去重场景下,对数据进行预聚合。 HLL列只能通过配套的 HLL列只能通过配套的 hll_union_agg、hll_cardinality、hll_hash 进行查询或使用。 BITMAP 数据类型 BITMAP 数据类型 BITMAP 类型是一个二进制类型。BITMAP 类型只能用于聚合类型的表(Aggregation Table),并且必须指定聚合类型为 BITMAP_UNION。 BITMAP 类型主要用于精确去重场景下,对数据进行预聚合。同 中查询数据并导入。 Example Example 1. 向 表中导入一行数据 其中第一条、第二条语句是一样的效果。在不指定目标列时,使用表中的列顺序来作为默认的目标列。 第三条、第四条语句表达的意思是一样的,使用 列的默认值,来完成数据导入。 2. 向 表中一次性导入多行数据 其中第一条、第二条语句效果一样,向 表中一次性导入两条数据 第三条、第四条语句效果已知,使用 列的默认值向 表中导入两条数据0 码力 | 203 页 | 1.75 MB | 1 年前3
 SelectDB案例 从 ClickHouse 到 Apache Doris加速层:在数仓中构建的大宽表导入到加速层中,Clickhouse 作为分析引擎, Elasticsearch 作为搜索/圈选引擎。  应用层:根据场景创建 DataSet,作为逻辑视图从大宽表选取所需的标签与指标,同 时可以二次定义衍生的标签与指标。 存在的问题:  数仓层:不支持部分列更新,当上游任一来源表产生延迟,均会造成大宽表延迟, 进而导致数据时效性下降。  加速层:不同的标签跟指标特性不同、更新频率也各不相同。由于 写入压力,我们考虑在数据写入 Doris 之前,尽量将数据生成宽表,再写 入到 Doris 中。针对宽表的生成,我们有两个实现思路:第一个是在 TDW 数仓中生成宽 表;第二个是 Flink 中生成宽表。我们对这两个实现思路进行了实践对比,最终决定选择第 二个实现思路,原因如下: 在 TDW 中生成宽表,虽然链路简单,但是弊端也比较明显。  存储成本较高, TDW 除了要维护离散的 80 +个 Source0 码力 | 12 页 | 1.55 MB | 1 年前3 SelectDB案例 从 ClickHouse 到 Apache Doris加速层:在数仓中构建的大宽表导入到加速层中,Clickhouse 作为分析引擎, Elasticsearch 作为搜索/圈选引擎。  应用层:根据场景创建 DataSet,作为逻辑视图从大宽表选取所需的标签与指标,同 时可以二次定义衍生的标签与指标。 存在的问题:  数仓层:不支持部分列更新,当上游任一来源表产生延迟,均会造成大宽表延迟, 进而导致数据时效性下降。  加速层:不同的标签跟指标特性不同、更新频率也各不相同。由于 写入压力,我们考虑在数据写入 Doris 之前,尽量将数据生成宽表,再写 入到 Doris 中。针对宽表的生成,我们有两个实现思路:第一个是在 TDW 数仓中生成宽 表;第二个是 Flink 中生成宽表。我们对这两个实现思路进行了实践对比,最终决定选择第 二个实现思路,原因如下: 在 TDW 中生成宽表,虽然链路简单,但是弊端也比较明显。  存储成本较高, TDW 除了要维护离散的 80 +个 Source0 码力 | 12 页 | 1.55 MB | 1 年前3
 Apache Doris 在美团外卖数仓中的应用实践兼容MySQL协议和标准SQL。 支持Rollup Table和Rollup Table的智能查询路由。 支持较好的多表Join策略和灵活的表达式查询。 支持Schema在线变更。 支持Range和Hash二级分区。 4 / 8 Apache Doris在美团外卖数仓中的应用实践 Spark大数据博客 - https://www0 码力 | 8 页 | 429.42 KB | 1 年前3 Apache Doris 在美团外卖数仓中的应用实践兼容MySQL协议和标准SQL。 支持Rollup Table和Rollup Table的智能查询路由。 支持较好的多表Join策略和灵活的表达式查询。 支持Schema在线变更。 支持Range和Hash二级分区。 4 / 8 Apache Doris在美团外卖数仓中的应用实践 Spark大数据博客 - https://www0 码力 | 8 页 | 429.42 KB | 1 年前3
共 3 条
- 1













