本研究では、3D Gaussian Splattingを用いた新しい視覚的ローカリゼーションのフレームワークであるGSplatLocを提案している。
まず、3D Gaussian Splattingモデルを使ってシーンをモデル化する。この際、XFeatネットワークによって抽出された特徴記述子を統合する。
次に、2段階のプロセスでカメラの姿勢を推定する。まず、3D Gaussian Splattingモデル内の3D特徴と、クエリ画像の2D特徴との対応関係を使って、粗い姿勢推定を行う。その後、レンダリングベースの最適化を行うことで、姿勢推定の精度を高める。
実験の結果、GSplatLocは室内外のデータセットで最先端の手法を上回る精度を達成した。特に、3D Gaussian Splattingによる特徴の統合と、レンダリングベースの最適化が、高精度な姿勢推定に寄与していることが示された。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문