核心概念
本文提出了一種基於分佈式樹狀空間索引結構 (DITS) 的多源空間資料集搜尋框架,用於解決空間資料集上的重疊可連接搜尋問題 (OJSP) 和覆蓋可連接搜尋問題 (CJSP)。
這篇研究論文探討了在多源空間資料集中進行可連接搜尋的議題,特別關注於重疊和覆蓋兩種搜尋類型。傳統的空間查詢方法需要使用者明確指定要連接的資料集,對於不熟悉資料源的新手使用者來說是一項挑戰。為了解決這個問題,本文提出了兩種新型態的可連接搜尋問題:重疊可連接搜尋問題 (OJSP) 和覆蓋可連接搜尋問題 (CJSP)。
OJSP 和 CJSP 的定義
OJSP:旨在從多個空間資料源中找出 k 個與查詢資料集具有最大空間重疊的資料集。
CJSP:旨在找出 k 個與查詢資料集連接後具有最大空間覆蓋範圍的資料集,同時確保結果與查詢之間的空間連通性。
挑戰
設計一個同時支援 OJSP 和 CJSP 的高效索引結構。
打破不同空間資料源之間的障礙,促進跨資料源的可連接搜尋。
設計高效的搜尋演算法和策略,以加速大規模資料集上的可連接搜尋過程。
主要貢獻
定義 OJSP 和 CJSP:首次定義了兩種基於空間資料集的可連接搜尋問題,並證明了 CJSP 的 NP 難度。
開發高效的搜尋框架:提出了一個支援 OJSP 和 CJSP 的高效搜尋框架。
設計 DITS 索引結構:設計了一個分佈式樹狀空間索引結構 (DITS),由本地索引和全局索引組成,不僅可以加速本地 OJSP 和 CJSP,還可以支援多個資料源之間的高效通訊。
設計查詢分佈策略:設計了兩種查詢分佈策略,通過減少通訊頻率和傳輸位元組數來降低通訊成本。
設計高效的搜尋演算法:針對 OJSP,設計了一個高效的過濾驗證演算法;針對 CJSP,提出了一個基於空間合併的貪婪近似演算法。
實驗結果
在五個真實世界的空間資料源上進行的實驗結果表明,與基準方法相比,本文提出的框架在解決 OJSP 和 CJSP 方面非常有效和高效。