本論文は、3次元(3D)再構築のための画像マッチング手法の包括的な評価を行っている。
まず、従来の特徴抽出・マッチング手法(SIFT、SURF、ORB)と近年のディープラーニング手法(LIFT、DISK、SuperPoint、ALIKED、DeDoDe、XFeat、LoFTR、RoMa、MASt3R等)を比較した。
評価には、ドメイン内のNianticデータセットと、ドメイン外のIMC24データセットを使用した。IMC24には、照明変化、季節変化、回転、遮蔽、透明物体などの課題が含まれる。
評価の結果、以下のことが明らかになった:
多くの手法はドメイン外の課題に対して汎化性が低く、特に透明物体シーンでは全ての手法が失敗した。この分野は未解決の課題である。
一般的に使われているmAA指標には曖昧さがあり、未登録画像の扱いによって結果が大きく変わる可能性がある。登録成功率と姿勢精度が混同されている。
IMC24データセットの結果が全体的に低いことから、実世界の多様性をよりよく捉えたデータセットの必要性が示された。
手法の選択は状況依存的であり、本評価は研究者が適切な手法を選択・開発する際の指針となる。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor