SelectDB案例 从 ClickHouse 到 Apache DorisDoris,腾讯音乐内容库数据平台架构演进实践 2023/02/20SelectDB 用户案例 导读:腾讯音乐内容库数据平台旨在为应用层提供库存盘点、分群画像、指标分析、标签圈 选等内容分析服务,高效为业务赋能。目前,内容库数据平台的数据架构已经从 1.0 演进到 了 4.0 ,经历了分析引擎从 ClickHouse 到 Apache Doris 的替换、经历了数据架构语义层 的初步引入到深度应用,有效提 腾讯音乐娱乐拥有海量的内容曲库,包括录制音乐、现场音乐、音频和视频等多种形式。通 过技术和数据的赋能,腾讯音乐娱乐持续创新产品,为用户带来更好的产品体验,提高用户 参与度,也为音乐人和合作伙伴在音乐的制作、发行和销售方面提供更大的支持。 在业务运营过程中我们需要对包括歌曲、词曲、专辑、艺人在内的内容对象进行全方位分析, 高效为业务赋能,内容库数据平台旨在集成各数据源的数据,整合形成内容数据资产(以指 标和标签体系0 码力 | 12 页 | 1.55 MB | 1 年前3
Doris的数据导入机制以及原子性保证全新的数据模型,查询存储 效率大幅提升 • MPP框架,支持分布式计算 2013 • 精简架构、统一用户客户端, 实现高可用 • 正式开始对外提供服务 2015 • 正式开源 • 希望能帮助更多人、让更多 人帮助Doris 2017 • 贡献给Apache社区,更名 为Apache Doris • 截止目前,社区2000+star, Contributor 100+,一线互0 码力 | 33 页 | 21.95 MB | 1 年前3
百度智能云 Apache Doris 文档的机制来保证数据导入的不丢不重。具体说明可以参阅 导入事务和原子性 文档。 4. 列映射、衍生列和过滤 Doris 可以在导入语句中支持非常丰富的列转换和过滤操作。支持绝大多数内置函数和 UDF。关于如何正确的使用这个功 能,可参阅 列的映射,转换与过滤 文档。 5. 错误数据过滤 Doris 的导入任务可以容忍一部分格式错误的数据。容忍了通过 设置。默认为0,即表示当有一条错误数据 时,整个导入任务将会失败。 单字节。 :指定导出的行分隔符,默认为\n。仅支持单字节。 :导出在单个 BE 节点的内存使用上限,默认为 2GB,单位为字节。 :导入作业的超时时间,默认为2小时,单位是秒。 :每个子任务能分配扫描的最大 Tablet 数量。 导出功能需要通过 Broker 进程写数据到远端存储上。这里需要定义相关的连接信息供 Broker 使用。 Example Example 1. 将 testTbl 的机制来保证数据导入的不丢不重。具体说明可以参阅 导入事务和原子性 文档。 5. 列映射、衍生列和过滤 Doris 可以在导入语句中支持非常丰富的列转换和过滤操作。支持绝大多数内置函数和 UDF。关于如何正确的使用这个功 能,可参阅 列的映射,转换与过滤 文档。 6. 错误数据过滤 Doris 的导入任务可以容忍一部分格式错误的数据。容忍率通过 设置。默认为0,即表示当有一条错误数据 时,整个导入任务将会失败。0 码力 | 203 页 | 1.75 MB | 1 年前3
Apache Doris 在美团外卖数仓中的应用实践幅简化,现场查询时的 IO、CPU、内存,网络资源也会显著减少,并且不再会随着数据规模而线性增加。 总结与思考 在外卖运营分析的业务实践中,由于业务的复杂及应用场景的不同,没有哪一种数据生产方案能 够解决所有业务问题。数据库引擎技术的发展,为我们提供更多手段提升数据建设方案。实践证 明,以Doris引擎为驱动的ROLAP模式可以较好地处理汇总与明细、变化维的历史回溯、非预设维 的灵活应用、准实0 码力 | 8 页 | 429.42 KB | 1 年前3
共 4 条
- 1













