本論文では、カメラ姿勢の情報なしでスパースな入力画像からの新規ビューの合成を可能にする、構築と最適化を組み合わせた手法を提案する。モノラル深度推定と3D Gaussianスプラッティングを活用し、カメラ姿勢と深度の整合性を取りながら、2D対応点を用いた最適化を行うことで、高品質な新規ビューを生成できる。