Keskeiset käsitteet
マーカーレスモバイルAR向けの絶対姿勢回帰(APR)は、単一の単眼画像から6自由度のカメラ姿勢を推定する機械学習ソリューションです。APRは計算コストが低いため、モバイルAR機器の制限された計算リソースで直接実行できます。しかし、APRは訓練セットから大きく外れた入力画像に対して大きな誤差を生み出す傾向があります。本論文では、APRの推定結果と訓練セットの事前画像の推定結果を組み合わせることで、最小限のオーバーヘッドでAPRの信頼性を評価するKS-APRパイプラインを提案します。モバイルARシステムは通常、デバイスの相対姿勢を追跡するためにビジュアル慣性オドメトリ(VIO)に依存しています。したがって、KS-APRは信頼性を優先し、信頼できない姿勢を破棄します。このパイプラインは既存のほとんどのAPR手法に統合でき、信頼できない画像をフィルタリングすることで精度を向上させることができます。
Tiivistelmä
本論文では、キーフレーム選択パイプラインKS-APRを提案しています。KS-APRは、APRの推定結果と訓練セットの事前画像の推定結果を組み合わせることで、最小限のオーバーヘッドでAPRの信頼性を評価します。
具体的な手順は以下の通りです:
- 入力画像Iに対してAPRが6自由度のカメラ姿勢< ˆx, ˆq >を出力する。
- 特徴抽出器Fを使って、画像Iの特徴点とディスクリプタを抽出する。
- アルゴリズム1のRetrievalImage(ˆx, ˆq)を使って、訓練セットから姿勢が最も近い画像I'を検索する。
- 画像IとI'の特徴点を照合し、マッチング数が一定のしきい値γ以上であれば、Iをキーフレームとして識別する。そうでなければ、Iは破棄される。
KS-APRは、APRの推定結果と訓練セットの事前画像の推定結果を組み合わせることで、信頼できる姿勢推定を識別します。これにより、APRの精度と頑健性を大幅に向上させることができます。
Tilastot
訓練セットの画像と対応する真の姿勢ラベルを使用する
入力画像Iの推定姿勢< ˆx, ˆq >と訓練セットの画像の姿勢< x', q' >の距離を計算する
位置誤差: ∆ˆx = ||ˆx - x'||2
姿勢誤差: ∆ˆq = ||ˆq/||ˆq|| - q'||2