本論文では、カメラポーズの推定問題を、画像分布とポーズ分布の関係をモデル化する問題として捉えている。具体的には以下の手順で行う:
NeRFを用いて、低解像度の合成画像を大量に生成する。これにより、ポーズのサンプリングと画像の生成を効率的に行える。
生成した画像とポーズのペアデータを用いて、可逆ニューラルネットワーク(INN)を学習する。INNは画像の潜在表現とポーズの間の写像を学習する。
学習したINNを用いて、入力画像に対するポーズの事後分布を推定できる。これにより、ポーズの不確実性を定量化できる。
実験では、公開データセットでの絶対ポーズ推定タスクと、実際のロボットプラットフォームでの位置推定タスクで評価を行った。提案手法は、従来手法と同等の精度を達成しつつ、データ生成コストが低く、組み込み向けのプラットフォームでも高速に動作することを示した。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Zirui Zang,A... om arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13288.pdfDiepere vragen