本論文では、SPVLoc と呼ばれる新しい手法を提示する。これは、室内環境の意味的パノラマレイアウト表現と、クエリ画像のビューポートを照合することで、6D カメラ姿勢を推定する手法である。
パノラマは、3D参照モデルから合成されたものであり、部屋の形状、ドア、窓などの概略的な構造情報のみを含む。
提案手法では、畳み込みネットワークの単純な構造でも、画像とパノラマの照合、ひいては画像とモデルの照合を効果的に実現できることを示す。
ビューポートの分類スコアに基づいて参照パノラマを順位付けし、クエリ画像との最良のマッチを選択する。その後、選択したパノラマに対する6D相対姿勢を推定する。
実験では、提案手法が既存手法と比べて高い位置推定精度を達成し、より多くの自由度のカメラ姿勢を推定できることを示す。また、学習データのない未知のシーンにも適用可能であることを実証する。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Niklas Gard,... a las arxiv.org 04-17-2024
https://arxiv.org/pdf/2404.10527.pdfConsultas más profundas