核心概念
深度画像のみを入力として、可視領域と遮蔽領域の両方を正確に再構築する新しい3Dシーン再構築手法を提案する。
要約
本論文は、深度画像のみを入力として、室内3Dシーンの可視領域と遮蔽領域の両方を正確に再構築する新しい手法を提案する。
提案手法の特徴は以下の通り:
階層的オクツリー表現と双デコーダ構造を組み合わせることで、可視領域と遮蔽領域を別々に処理する。
可視領域の再構築には詳細な表現を用いる一方で、遮蔽領域の補完には抽象的な表現を用いる。
可視領域の再構築は入力シーンに特化して最適化するが、遮蔽領域の補完は複数シーンのデータを用いて事前に学習する。
これにより、提案手法は既存手法よりも遮蔽領域の再構築精度を大幅に向上させることができる。3D-CRSデータセットとiTHORデータセットでの評価実験では、既存手法と比べて完全性指標で16.8%と24.2%の改善を示した。
統計
可視領域と遮蔽領域の両方を含む3Dシーンの完全性指標は、既存手法と比べて16.8%と24.2%の改善を示した。
可視領域のみを対象とした正確性指標では、既存手法と同等の性能を示した。
引用
本手法は、可視領域と遮蔽領域を別々に処理することで、遮蔽領域の正確な再構築を実現している。
事前学習した遮蔽領域補完モジュールと、入力シーンに特化した可視領域再構築モジュールを組み合わせることで、高精度な3Dシーン再構築を実現している。