Core Concepts
NeRF を用いた frame-to-model最適化フレームワークにより、RGB-D 画像の無監督登録を実現する。合成データを用いた事前学習により、実世界データでの登録精度を向上させる。
Abstract
本論文は、RGB-D 画像の頑健な登録モデルを無監督で学習する手法を提案している。従来の手法は、2つのフレーム間の光度および幾何学的整合性を用いた教師なし学習を行っていたが、照明変化や遮蔽、反射などの要因により、多視点整合性が低下する問題があった。
本手法では、NeRFを用いた frame-to-model最適化フレームワークを提案する。NeRFは入力フレームと再レンダリングされたフレームの整合性を最適化することで、より頑健な登録モデルを学習できる。さらに、合成データを用いた事前学習により、実世界データでの登録精度を向上させている。
実験では、ScanNetおよび3DMatchデータセットにおいて、従来手法を大きく上回る性能を示している。特に、重複領域が小さい場合や照明変化が大きい場合でも優れた性能を発揮する。また、各モジュールの効果を検証する詳細な実験も行っている。
Stats
照明変化や遮蔽、反射などの要因により、従来手法では多視点整合性が低下する
提案手法のNeRF最適化により、入力フレームと再レンダリングされたフレームの整合性を高められる
合成データを用いた事前学習により、実世界データでの登録精度を向上できる
Quotes
"NeRF-UR, a novel frame-to-model optimization framework for unsupervised RGB-D registration."
"To overcome the reliance on annotated data in learning-based methods, the exploration of better strategies to extract information from unlabeled data for achieving unsupervised learning in RGB-D registration has gradually become a research focus."
"Our method outperforms both traditional and recent unsupervised learning-based registration pipelines. Moreover, our method achieves significantly better performance than previous methods in more challenging scenarios with lower overlap or severe lighting changes."