Core Concepts
カメラポーズを時間の連続関数として最適化することの効果的な方法を提案し、実験結果によりその有用性を示す。
Abstract
この論文では、モノクルカメラのポーズを時間の連続関数として最適化する手法が提案されています。これにより、異なるアプリケーションで優れたパフォーマンスが得られることが示されています。具体的には、不正確な姿勢からNeRFへの応用や非同期イベントからの3Dシーン再構築などが挙げられます。さらに、PoseNetを使用したIMU-Fusionや固有運動フレームの導入によるトラッキング性能向上も報告されています。
Stats
高頻度または非同期測定値を直接利用することで中間測定値の誤差蓄積を回避します。
低次元自由度(DOF)運動表現を活用して追跡性能を向上させます。
PoseNetは8層MLPで構成され、256次元隠れ層があります。
ネットワークサイズによってカメラ位置特定性能が影響されます。
PoseNetは異なる参照座標系で出力されます。
Quotes
"High frequency or asynchronous measurements can be utilized directly without accumulation, integral, or rounding."
"We exploit the proposed method in four diverse experimental settings, namely NeRF from noisy poses; NeRF from asynchronous Events; Visual Simultaneous Localization and Mapping (vSLAM); and vSLAM with IMUs."
"Our major contributions can be summarized as follows: We propose a simple yet effective way to represent the monocular camera motion via a neural function of time that can be optimized efficiently together with implicit neural representations."