本研究は、時間の経過とともに変化する3D環境を「生きる空間」として捉え、その理解を深めることを目的としている。具体的には以下の3つのタスクに取り組む。
物体のマッチング: 時間的に異なる2つのスキャンから、同一物体を対応付ける。特徴量の類似性と位置合わせの一致度を組み合わせて、物体のマッチングを行う。
物体の位置合わせ: マッチングされた物体の点群データについて、6自由度の変換を推定し、位置合わせを行う。点群とニューラルインプリシット関数の整合性を最小化することで、高精度な位置合わせを実現する。
物体の再構築: 位置合わせされた点群データを蓄積し、ニューラルインプリシット関数を用いて物体の3Dメッシュを再構築する。複数のスキャンから得られる情報を統合することで、物体の幾何学的な精度と完全性を向上させる。
提案手法は、単一のエンコーダ-デコーダネットワークを用いて、これらの3つのタスクを統一的に解決する。また、位置合わせと再構築の最適化を組み合わせることで、時間の経過とともに物体の表現が改善されていく。実験の結果、提案手法は既存手法と比べて、エンドツーエンドの性能と個別のタスクの性能においても優れていることが示された。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania