Core Concepts
本研究では、カメラキャリブレーションなしで、複数の第一人称視点(FPV)カメラ画像から、鳥瞰図(BEV)上の被写体の位置と向きならびにカメラの位置と向きを同時に推定する新しい問題に取り組む。
Abstract
本研究では、カメラキャリブレーションなしで、複数のFPV画像から、BEV上の被写体の位置と向き、およびカメラの位置と向きを同時に推定する新しい問題に取り組む。
提案手法の主な特徴は以下の通り:
被写体の視点変換モジュール(VTM)を使って、各被写体をFPVからBEVに投影する。
多視点幾何学に基づく空間整列モジュール(SAM)を使って、統一されたBEV上でカメラの相対姿勢を推定する。
被写体とカメラの位置合わせ結果を選択・精緻化する。
提案手法は、深層学習ベースの一般化性と古典的幾何学の安定性を組み合わせている。
実験結果は、提案手法の顕著な有効性を示している。また、実データでの評価も良好な結果を示しており、提案手法の汎化性を確認できた。
Stats
カメラ位置の平均誤差は0.89m以下
カメラ向きの平均誤差は5.78度以下
被写体位置の平均誤差は0.75m以下
被写体向きの平均誤差は14.67度以下