本稿は、LiDARデータを用いたニューラル放射輝度場(NeRF)の学習における、複数反射への対応に関する研究論文である。NeRFは、シーンの連続的な表現をニューラルネットワークの重みに格納することで実現する技術であり、近年ではカメラ画像だけでなく、LiDAR点群にも応用されている。
従来のLiDARベースのNeRFでは、シーンを決定論的にモデル化していたため、窓や葉などの半透明な物体において、複数の反射が存在する場合に問題が生じていた。具体的には、センサーからの光線が複数の反射面と交差する場合、従来の手法ではそれらの反射面を平均化した「ファントムサーフェス」と呼ばれるアーティファクトが発生し、シーンの正確な表現が困難であった。
本稿では、この問題を解決するために、反射を確率密度として表現する新しい手法を提案する。具体的には、従来のNeRFにおける光学密度場を、反射確率場に置き換えることで、各光線に沿って複数の反射の可能性を表現することを可能にした。
本稿で提案する手法では、光線の経路に沿った微分確率σ(s)を積分することで、累積確率分布C(s)を構築する。このσ(s)は、LiDARの位置x0と視線方向λを入力とする関数F(x0, λ)によってモデル化され、ニューラルネットワークによって学習される。
学習には、C(s)と、各測定値kに対して構築された単位ステップ関数u(dk)との二乗誤差を最小化する損失関数LCを用いる。これにより、ネットワークは、観測された測定値を再現する確率密度を学習する。
提案手法の有効性を検証するために、Newer College DatasetとMai City Datasetを用いて実験を行った。Newer College Datasetは、窓などの半透明な物体が多数存在する屋外のシーンであり、Mai City Datasetは、半透明な物体が存在しない都市環境のシミュレーションデータである。
実験の結果、Newer College Datasetにおいて、提案手法は従来手法と比較して、マップの完成度において大幅な改善を示した。これは、提案手法が、窓などの半透明な物体を正確に表現できるためであると考えられる。一方、Mai City Datasetにおいては、提案手法は従来手法と同等の性能を示した。これは、Mai City Datasetには半透明な物体が存在しないため、提案手法の利点が活かされなかったためであると考えられる。
本稿では、LiDARデータからNeRFを学習する際に、反射を確率密度として表現する新しい手法を提案した。提案手法は、従来手法と比較して、複数反射が存在する場面において、より正確なシーン表現を実現できることを示した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問