本論文は、単眼画像から深度と法線を統合的に推定する新しい手法を提案する。従来の手法は深度推定と法線推定を個別に行っており、両者の幾何学的な整合性を考慮できていなかった。
提案手法では、まず入力画像から幾何学的コンテキストを抽出する。このコンテキストは局所的な3D幾何の変化を表現しており、深度推定と法線推定の整合性を保つための重要な情報源となる。
具体的には、提案手法は以下の2つの特徴を持つ:
適応的表面法線(ASN)制約:
深度から回復した法線と ground truth 法線の整合性を最小化するように学習する。ASN制約は、幾何学的コンテキストを活用して、局所的な信頼できる幾何情報を動的に決定することで、深度推定と法線推定の整合性を保つ。
幾何学的コンテキストガイド法線推定:
幾何学的コンテキストを活用して、画像中の幾何学的詳細が豊富な領域に注目し、それらの領域の法線推定精度を高める。
これらの特徴により、提案手法は単眼画像から高品質な3D幾何情報を生成できる。実験では、室内外の様々なデータセットで提案手法の優位性を示している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Xiaoxiao Lon... at arxiv.org 04-02-2024
https://arxiv.org/pdf/2402.05869.pdfDeeper Inquiries