核心概念
視覚的場所認識では、クエリ画像と参照画像のマッチングの信頼性を推定することが重要である。本研究では、既存の3つのアプローチ(検索ベース、データ駆動型、幾何学的検証)に加え、新しい簡単なベースライン手法(SUE)を提案し、それらの性能を比較・評価した。
要約
本研究は、視覚的場所認識(VPR)における画像マッチングの不確実性推定に関する手法を比較・検討したものである。
まず、VPRにおける不確実性推定の3つの主要なアプローチを紹介した:
検索ベース(RUE): 特徴空間上の距離を不確実性の指標とする手法
データ駆動型(DUE): 訓練データから不確実性を学習する手法
幾何学的検証(GV): 局所特徴量のマッチングを用いる手法
次に、これらのアプローチとは異なり、参照画像の位置情報を活用する新しい簡単なベースライン手法SUEを提案した。SUEは、上位K個の参照画像の位置分散を不確実性の指標とする。
実験では、これらの手法の性能を複数のベンチマークデータセットで比較した。その結果、SUEが他の効率的な手法を上回り、GVと同等の性能を示すことが分かった。さらに、SUEの不確実性推定がGVと相補的であることも明らかになった。
SUEのハイパーパラメータに関する分析も行い、その設定が比較的ロバストであることを示した。
本研究の知見として、VPRにおける不確実性推定では、単純なL2距離が最新の学習ベースの手法よりも優れていること、参照画像の位置情報を活用するSUEが有効であること、GVと他の手法の組み合わせが有効であることなどが挙げられる。
統計
参照画像の位置分散が小さいほど、画像マッチングの不確実性が低い。
参照画像の位置分散が大きいほど、画像マッチングの不確実性が高い。
引用
"Highly certain but incorrect retrieval can lead to catastrophic failure of VPR-based localization pipelines."
"Reliable uncertainty estimation on the quality of the match is therefore key to avoid such failures by, e.g., rejecting results above a certain uncertainty threshold."