Core Concepts
リアルワールドのデータを「背景」と「オブジェクト」に分割し、それらを組み合わせることで、大規模かつ多様なLiDARデータセットを低コストで生成できる。
Abstract
本論文では、Paved2Paradise (P2P)と呼ばれる、LiDARデータセットを合成するための簡単かつコスト効率的なアプローチを提案している。
主な特徴は以下の通り:
「背景」と「オブジェクト」のデータを別々に収集し、それらを組み合わせることで、大規模かつ多様なデータセットを生成する。
オブジェクトの位置や向きを調整することで、センサーの視点に整合性のある合成シーンを生成する。
遮蔽効果やセンサー特性を模擬することで、より現実的なLiDARデータを生成する。
この手法を用いて、人検出タスクのためのオーチャードデータセットと歩行者検出タスクのための都市部データセットを生成した。
オーチャードデータセットに対してはPaved2Paradiseで生成したデータのみを使って学習したモデルが高い性能を示し、都市部データセットに対してもPaved2Paradiseで生成したデータを使ったモデルが既存のデータセットを使ったモデルと同等の性能を発揮した。
これらの結果から、Paved2Paradiseは、LiDARデータの収集が困難な分野でのモデル開発を加速できる可能性が示された。
Stats
本研究で収集した背景シーンは6,717フレームで、歩行者検出タスクのためにはKITTIデータセットから5,581フレームを使用した。
オブジェクトシーンは21,263フレームを収集し、そのうち11,054フレームを歩行者検出タスクに使用した。
合成データセットは各タスクで500,000サンプル生成し、訓練セットと検証セットに分割した。