核心概念
提出一種自適應成本模型(ACM),動態優化與CPU和I/O相關的計劃成本參數,以提高查詢優化器的決策準確性。
摘要
本文提出了一種自適應成本模型(ACM),用於動態優化與CPU和I/O相關的計劃成本參數。
ACM包含兩個主要組件:
-
磁盤相關參數模型:
- 根據緩存命中率動態調整隨機訪問頁面的成本
- 使用歷史查詢執行統計數據預測緩存命中率
-
CPU相關參數模型:
- 收集查詢運算符的執行統計數據,包括執行時間和處理的元組數
- 使用線性回歸模型動態調整與CPU相關的成本參數,如每元組處理成本、每操作成本和每索引元組成本
這種方法不需要預先訓練或定期運行校準查詢,並且基於輕量級學習模型,可以在資料庫內核中實現。
實驗結果顯示,與標準成本模型相比,ACM�顯著提高了成本和實際執行時間之間的相關性,並在TPC-H基準測試中實現了20%的端到端延遲改善。
統計資料
使用標準成本模型時,成本和執行時間的相關性為0.29
使用ACM時,成本和執行時間的相關性提高到0.92
在TPC-H基準測試中,使用ACM的查詢延遲整體改善了20%
引述
"在現代數據庫中,成本估算可能會錯誤幾個數量級(例如,在估算具有多個連接的複雜查詢的成本時)。"
"為了減少成本估算錯誤,必須同時提高基數估算的準確性和成本模型參數調整。"