分布式HTAP資料庫
㈠ 面向HTAP資料庫的基準評測工具研究進展
隨著在線實時分析需求的增長,HTAP(Hybrid Transaction and Analytical Process)資料庫隨之出現。HTAP資料庫能在同一個系統內實現OLTP負載和OLAP負載的高效處理,提供了對新鮮數據的分析能力。近年來,工業界和學術界提出了多種HTAP資料庫架構,因此如何評測各種新型的HTAP資料庫引起了學界和業界的廣泛關注。本文主要探討面向HTAP資料庫的基準評測工具,以及研究進展。
本文總結了近年來代表性HTAP評測基準,旨在服務HTAP資料庫系統評測需求。為了滿足這一需求,本文提出了一個面向HTAP資料庫的基準評測工具,以及對這一領域的重要研究進展的深入分析。閱讀本文後,讀者將能夠對這一話題有新的收獲,並歡迎讀者對不同的看法進行評論和探討。
本文主要探討面向HTAP資料庫的基準評測工具,以及研究進展。OceanBase作為從OLTP資料庫系統擴展而來的分布式HTAP資料庫系統,它提供了兩種資源隔離方案。在後續文章中,我們將陸續發布OceanBase對HTAP負載的支持能力測試報告。
為了評測HTAP資料庫實現的難點,即TP(事務處理)和AP(分析處理)的資源隔離和數據同步,現有的評測基準更加關注兩個關鍵問題:混合負載生成和負載指標。混合負載生成涉及生成TP和AP負載,並控制它們之間的數據訪問交叉。負載指標則量化評測混合負載運行時的隔離性,即相互之間的干擾程度。
本文分析了主流的HTAP評測基準(工具):CH-benCHmark(2011)、HTAPBench(2017)、OLxPBench(2022)和HATtrick(2022)。它們在表模式和負載、測試方法、控制方法、測試指標等方面各有特色。例如,CH-benCHmark是第一個官方提出的混合負載評測基準,HTAPBench通過指定應用可以容忍的OLTP目標吞吐下限范圍進行評測,OLxPBench設計了面向不同場景的負載,HATtrick提出了隔離性和新鮮數據訪問的評價指標。
在表模式和負載方面,CH-benCHmark基於TPC-C和TPC-H表模式完成定義,而HTAPBench和OLxPBench使用了相似的模式。在測試方法上,HTAPBench通過指定應用可以容忍的OLTP目標吞吐下限范圍進行評測,而OLxPBench和HATtrick與HTAPBench相同。在控制方法上,HTAPBench提出控制分析任務復雜度和查詢訪問模式,OLxPBench設計了面向不同場景的負載。在測試指標方面,HTAPBench使用吞吐量進行比較,而OLxPBench結合了HTAPBench和CH-benCHmark的指標,HATtrick提出了隔離性和新鮮數據訪問的評價指標。
總之,本文總結了面向HTAP資料庫的基準評測工具的最新研究進展,包括表模式和負載、測試方法、控制方法、測試指標等方面。通過對比不同基準的特性和優缺點,本文為讀者提供了一個全面的分析,旨在為HTAP資料庫的評測工作提供參考和借鑒。