核心概念
絶対的な翻訳スケールを推定しながら、精度と堅牢性を兼ね備えた方法を提供する。
摘要
画像間の相対カメラ位置の推定は、コンピュータビジョンにおける中心的な問題であり、本研究では学習ベースとソルバーベースの手法を組み合わせて高い精度と堅牢性を実現しています。提案された方法は、従来の手法よりも優れた結果をもたらし、様々なバックボーンやソルバーに柔軟に適応します。さらに、データセットのサイズが増加すると、Transformerが最終出力に与える影響が大きくなり、全体的なパフォーマンスが向上することが示唆されています。
統計資料
我々の方法は平均回転誤差を0.60°まで減少させました。
平均翻訳誤差は1.16mから0.49mまで減少しました。
絶対値1m未満の誤差率は98.5%まで向上しました。
引述
"Our method reduces the median and mean translation errors by about 50%."
"FAR enhances the best results achieved by both the Transformer and Solver."
"The full method offers the best of all: precise estimation on ground truth correspondences with the best or equal to best robustness to noise and outliers."