核心概念
本文研究了在度量空間中修復不一致資料庫的計算複雜性問題。目標是在最小化原始值與修復值之間的總距離的同時,更新資料庫值以保持一致性。我們考慮了所謂的共現約束,包括鍵約束、包含約束、外鍵約束以及任何對不同標籤(屬性)的單元格數量關係的限制。
要約
本文首先證明了這個問題對於一般度量空間是APX-hard的。然後,作者提出了一個最優算法,可以在多項式時間內解決樹度量的情況。結合這個算法和經典的概率樹嵌入結果,作者設計了一個(高概率)對數比近似算法來處理一般度量。
此外,作者還研究了限制每個單元格允許變化的變體。在這種情況下,即使對於一般度量,確定是否存在任何合法修復也是NP完全的。但是,作者為線性度量提出了一個多項式時間的最優修復算法。
統計
對於一般度量空間,最優修復問題是APX-hard的。
對於樹度量,可以在多項式時間內找到最優修復。
對於一般度量,可以設計出一個(高概率)對數比近似算法。
對於限制每個單元格變化的變體,即使對於單屬性或簡單包含約束,確定是否存在任何合法修復也是NP完全的。
對於線性度量,可以在多項式時間內找到最優修復。