本論文は、NeRFベースのモデルの幾何学的精度と写実的なレンダリングを向上させる手法を提案している。主な貢献は以下の通り:
単眼の表面法線と相対深度の予測を効果的に活用するためのパッチベースのレイサンプリング最適化と密度制限を提案した。これにより、密度ベースのモデルでも単眼の幾何情報を効果的に活用できるようになった。
パッチベースのレイサンプリングを用いて、仮想ビューと訓練ビューの間の正規化相互相関(NCC)と構造的類似性(SSIM)に基づく外観一貫性正則化を行った。これにより、NeRFモデルの全体的な構造と外観の質を大幅に向上させることができた。
疎視点シーンにおいて、モノキュラー深度予測と疎な多視点構造から得られる情報を組み合わせて密度分布を制限することで、NeRFモデルの幾何学的精度をさらに向上させた。
実験の結果、提案手法は既存のNeRFベースの手法に比べて、ETH3Dベンチマークにおける幾何学的精度を4倍、FreeNeRFの8倍改善し、写実的なレンダリングも実現できることを示した。これは、NeRFベースの最適化手法が従来のMVSアプローチを凌駕する可能性を示唆している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問