本研究では、GeoCalibと呼ばれる深層学習ネットワークを提案している。GeoCalibは、単一画像から内部パラメータ(焦点距離、主点、歪み係数)と重力方向を推定することができる。
従来の古典的アプローチは3D幾何学の制約を活用して高精度な推定ができるが、直線やバニッシングポイントが必要なため、自然環境では頑健性に欠ける。一方、学習ベースのアプローチは様々な視覚的手がかりを活用できるため頑健性は高いが、精度が劣る。
GeoCalibは、深層学習ネットワークと3D幾何学の最適化を組み合わせることで、高精度かつ頑健な推定を実現している。具体的には、ネットワークが画像から「視点ベクトル」と「緯度」という幾何的特徴を推定し、それらを最適化問題に組み込むことで、カメラパラメータを推定する。
この手法には以下のような利点がある:
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Alexander Ve... في arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06704.pdfاستفسارات أعمق