核心概念
本文提出了一種名為 HomoMatcher 的新型特徵匹配方法,該方法利用輕量級的單應性估計網絡來改進半稠密匹配框架中的精細匹配模塊,從而以較低的計算成本實現了與稠密匹配方法相當的精度。
摘要
論文資訊
標題:基於單應性估計實現半稠密效率的稠密特徵匹配方法:HomoMatcher
作者:Xiaolong Wang, Lei Yu, Yingying Zhang, Jiangwei Lao, Lixiang Ru, Liheng Zhong, Jingdong Chen, Yu Zhang, Ming Yang
機構:浙江大學,螞蟻集團
發表日期:2024 年 11 月 11 日
研究目標
本文旨在解決現有半稠密特徵匹配方法在精細匹配階段存在的精度和連續性問題,提出一種基於單應性估計的精細匹配模塊,以較低的計算成本實現高精度的稠密特徵匹配。
方法
HomoMatcher 採用了粗略到精細的匹配範式,首先利用現有的特徵增強方法和互為最近鄰策略在降採樣圖像上獲得粗略匹配結果。然後,針對每個粗略匹配點對,從高分辨率特徵圖中提取以其為中心的圖像塊,並利用輕量級的單應性估計網絡迭代地估計匹配圖像塊之間的單應性矩陣。通過該單應性矩陣,可以將源圖像塊上的任意點映射到目標圖像塊上,從而實現精細匹配和稠密匹配。
主要發現
- 與現有的基於點到塊匹配概率期望或直接回歸的精細匹配技術相比,基於單應性估計的精細匹配模塊可以通過塊到塊的全局對齊來抑制無關區域造成的空間方差,從而獲得更高的亞像素級匹配精度。
- 通過利用圖像塊之間的單應性估計,HomoMatcher 可以獲得圖像塊內任意位置的匹配結果,確保了關鍵點的可重複性,並能夠以半稠密方法的效率實現匹配結果的稠密化。
- 在 MegaDepth 和 ScanNet 數據集上的實驗結果表明,HomoMatcher 在匹配精度和效率方面均優於現有的半稠密匹配方法,並且在像素級精度方面與稠密匹配方法相當。
結論
HomoMatcher 提出了一種基於單應性估計的精細匹配模塊,有效地解決了現有半稠密特徵匹配方法在精細匹配階段存在的精度和連續性問題,以較低的計算成本實現了高精度的稠密特徵匹配,為計算機視覺中的各種應用提供了高效且精確的解決方案。
統計資料
ASpan Homo 在 MegaDepth 數據集上的 AUC@5 指標相較於 ASpanFormer 提升了 3.3%。
在配備單個 V100 GPU 的環境下,處理分辨率為 1152 的 MegaDepth 圖像時,ASpan Homo 的運行時間為 442 毫秒,而 RoMa 的運行時間為 1527 毫秒。
在 HPatches 數據集上,ASpan Homo 在 3px、5px 和 10px 像素誤差閾值下的 AUC 指標均優於 SuperGlue、LoFTR 和 ASpanFormer 等方法。