本論文は、LiDARベースの3Dオブジェクト検出における重要な課題である疎らさと遮蔽の問題に取り組んでいる。
まず、オブジェクト完全フレームの生成について説明している。これは、シーンの中のオブジェクトを複数の視点から統合することで、欠損した部分を補完するアプローチである。教師あり学習では、オブジェクトのトラッキングと点群登録を使ってこれを実現している。一方、教師なし学習では、事前学習済みモデルを使ってオブジェクトを検出・トラッキングし、点群登録によってオブジェクト完全フレームを生成する。
次に、教師-生徒フレームワークを用いたナレッジディスティレーションについて説明している。オブジェクト完全フレームを入力とした弱い教師モデルを事前に学習し、その知識を強い生徒モデルに蒸留することで、生徒モデルが疎らで遮蔽された入力データからも高品質な特徴を抽出できるようにする。
提案手法は、教師あり学習と半教師あり学習の両方で優れた性能を示している。教師あり学習では、既存の5つの3Dオブジェクト検出モデルの精度を1-2 mAP向上させている。半教師あり学習では、ONEEベンチマークにおいて最先端の手法を1-1.5 mAP上回る結果を得ている。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies