本研究では、3D Gaussian Splattingを用いた新しい視覚的ローカリゼーションのフレームワークであるGSplatLocを提案している。
まず、3D Gaussian Splattingモデルを使ってシーンをモデル化する。この際、XFeatネットワークによって抽出された特徴記述子を統合する。
次に、2段階のプロセスでカメラの姿勢を推定する。まず、3D Gaussian Splattingモデル内の3D特徴と、クエリ画像の2D特徴との対応関係を使って、粗い姿勢推定を行う。その後、レンダリングベースの最適化を行うことで、姿勢推定の精度を高める。
実験の結果、GSplatLocは室内外のデータセットで最先端の手法を上回る精度を達成した。特に、3D Gaussian Splattingによる特徴の統合と、レンダリングベースの最適化が、高精度な姿勢推定に寄与していることが示された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Gennady Sido... at arxiv.org 09-26-2024
https://arxiv.org/pdf/2409.16502.pdfDeeper Inquiries