核心概念
LoRANN 是一種基於叢集的近似最近鄰搜尋 (ANN) 方法,它利用監督式分數計算方法,透過降秩迴歸來近似查詢點和叢集點之間的內積,進而提升查詢速度和降低記憶體使用量。
摘要
LoRANN:一種用於近似最近鄰搜尋的低秩矩陣分解方法
論文資訊
- 作者:Elias Jääsaari, Ville Hyvönen, Teemu Roos
- 出處:NeurIPS 2024
研究目標
本研究旨在提出一個新的監督式分數計算方法,用於提升基於叢集的近似最近鄰搜尋 (ANN) 方法的查詢速度,使其能與領先的圖演算法相媲美。
方法
- 將計算查詢點和叢集點之間的差異視為一個多變量迴歸問題。
- 使用降秩迴歸 (RRR) 來近似最小平方誤差解,並透過低秩矩陣分解來降低計算複雜度。
- 使用 8 位元整數量化來進一步提升查詢速度和降低記憶體使用量。
- 開發一個名為 LoRANN 的基於叢集的 ANN 函式庫,該函式庫利用了所提出的分數計算方法,並包含 CPU 和 GPU 的高效能實作。
主要發現
- 在現代高維度資料集上,RRR 在查詢延遲和記憶體使用方面均優於產品量化 (PQ)。
- LoRANN 的查詢速度優於領先的基於叢集的函式庫 Faiss 和 ScaNN,並且在多數資料集上,其在召回率低於 90% 時的查詢速度優於領先的基於圖的函式庫 GLASS。
- LoRANN 在高維度資料集上優於最先進的 GPU ANN 方法。
主要結論
- RRR 是一種有效的基於叢集的 ANN 搜尋監督式分數計算方法。
- LoRANN 是一個具有競爭力的 ANN 函式庫,特別適用於記憶體使用受限的情況。
研究意義
本研究為基於叢集的 ANN 搜尋提供了一種新的高效能方法,並開發了一個實用的開源函式庫 LoRANN。
局限與未來研究方向
- 在需要探索大量叢集以達到最高召回率的情況下,圖演算法通常比基於叢集的方法更有效率。
- RRR 不適用於低維度資料集。
- 未來研究方向包括將 LoRANN 應用於更大的資料集,以及探索其他差異度量方法。
統計資料
在多數資料集上,LoRANN 在召回率低於 90% 時的查詢速度優於領先的基於圖的函式庫 GLASS。
RRR 在 bytes/vector 約為 16 時的效能優於 PQ 在 bytes/vector 約為 128 時的效能。
引述
"Our experiments show that on modern high-dimensional data sets, the proposed reduced-rank regression (RRR) method is superior to PQ in both query latency and memory usage."
"LoRANN is competitive with the leading graph-based algorithms and outperforms the state-of-the-art GPU ANN methods on high-dimensional data sets."