核心概念
ニューラルラジアンスフィールド(NeRF)は、静的シーンの新規ビュー合成と3Dシーン再構築に優れているが、一時的な障害物の存在に脆弱である。本研究では、ヒューリスティック誘導セグメンテーション(HuGS)という新しいパラダイムを提案し、手作業のヒューリスティックと最先端のセグメンテーションモデルの長所を組み合わせることで、静的シーンと一時的な障害物を正確に分離することができる。
要約
本研究は、ニューラルラジアンスフィールド(NeRF)の新規ビュー合成と3Dシーン再構築の性能を向上させるための新しいアプローチを提案している。
NeRFは静的シーンを前提としているが、実世界のシーンには一時的な障害物(移動物体やシャドウなど)が必ず存在する。これらの一時的な障害物は、NeRFの再構築結果に望ましくない人工物を引き起こす。
これまでの研究では、セグメンテーションモデルを使って一時的な障害物を検出する手法や、ヒューリスティックを使って静的シーンと一時的な障害物を分離する手法が提案されてきた。しかし、前者は事前知識に依存し、後者は精度が低いという問題があった。
本研究では、ヒューリスティック誘導セグメンテーション(HuGS)という新しいパラダイムを提案している。HuGSでは、手作業のヒューリスティックと最先端のセグメンテーションモデルの長所を組み合わせることで、静的シーンと一時的な障害物を正確に分離することができる。
具体的には、SfMベースのヒューリスティックと色残差ベースのヒューリスティックを融合し、高周波テクスチャと低周波テクスチャの両方の静的オブジェクトを効果的に捉えることができる。
実験の結果、HuGSはベースラインモデルに比べて大幅な性能向上を示し、非静的シーンにおけるNeRFの精度を大きく改善できることが確認された。
統計
静的オブジェクトの特徴点は、一時的なオブジェクトの特徴点に比べて、複数の画像で一致する数が圧倒的に多い。
部分的に訓練されたNerfactoモデルから得られる色残差は、静的オブジェクトの検出に有効である。
引用
"NeRF-HuGS: Improved Neural Radiance Fields in Non-static Scenes Using Heuristics-Guided Segmentation"
"We propose a novel paradigm called "Heuristics-Guided Segmentation" (HuGS) to maximize the accuracy of static vs. transient object identification for NeRF in non-static scenes."
"We delve into heuristic design and propose the seamless fusion of SfM-based heuristics and color residual ones to capture a wide range of static scene elements across various texture profiles, offering robust performance and superior results in mitigating transient distractors."