分布式HTAP数据库
㈠ 面向HTAP数据库的基准评测工具研究进展
随着在线实时分析需求的增长,HTAP(Hybrid Transaction and Analytical Process)数据库随之出现。HTAP数据库能在同一个系统内实现OLTP负载和OLAP负载的高效处理,提供了对新鲜数据的分析能力。近年来,工业界和学术界提出了多种HTAP数据库架构,因此如何评测各种新型的HTAP数据库引起了学界和业界的广泛关注。本文主要探讨面向HTAP数据库的基准评测工具,以及研究进展。
本文总结了近年来代表性HTAP评测基准,旨在服务HTAP数据库系统评测需求。为了满足这一需求,本文提出了一个面向HTAP数据库的基准评测工具,以及对这一领域的重要研究进展的深入分析。阅读本文后,读者将能够对这一话题有新的收获,并欢迎读者对不同的看法进行评论和探讨。
本文主要探讨面向HTAP数据库的基准评测工具,以及研究进展。OceanBase作为从OLTP数据库系统扩展而来的分布式HTAP数据库系统,它提供了两种资源隔离方案。在后续文章中,我们将陆续发布OceanBase对HTAP负载的支持能力测试报告。
为了评测HTAP数据库实现的难点,即TP(事务处理)和AP(分析处理)的资源隔离和数据同步,现有的评测基准更加关注两个关键问题:混合负载生成和负载指标。混合负载生成涉及生成TP和AP负载,并控制它们之间的数据访问交叉。负载指标则量化评测混合负载运行时的隔离性,即相互之间的干扰程度。
本文分析了主流的HTAP评测基准(工具):CH-benCHmark(2011)、HTAPBench(2017)、OLxPBench(2022)和HATtrick(2022)。它们在表模式和负载、测试方法、控制方法、测试指标等方面各有特色。例如,CH-benCHmark是第一个官方提出的混合负载评测基准,HTAPBench通过指定应用可以容忍的OLTP目标吞吐下限范围进行评测,OLxPBench设计了面向不同场景的负载,HATtrick提出了隔离性和新鲜数据访问的评价指标。
在表模式和负载方面,CH-benCHmark基于TPC-C和TPC-H表模式完成定义,而HTAPBench和OLxPBench使用了相似的模式。在测试方法上,HTAPBench通过指定应用可以容忍的OLTP目标吞吐下限范围进行评测,而OLxPBench和HATtrick与HTAPBench相同。在控制方法上,HTAPBench提出控制分析任务复杂度和查询访问模式,OLxPBench设计了面向不同场景的负载。在测试指标方面,HTAPBench使用吞吐量进行比较,而OLxPBench结合了HTAPBench和CH-benCHmark的指标,HATtrick提出了隔离性和新鲜数据访问的评价指标。
总之,本文总结了面向HTAP数据库的基准评测工具的最新研究进展,包括表模式和负载、测试方法、控制方法、测试指标等方面。通过对比不同基准的特性和优缺点,本文为读者提供了一个全面的分析,旨在为HTAP数据库的评测工作提供参考和借鉴。