Core Concepts
LiDARデータを用いて、移動物体を正確に検出・セグメンテーションする手法を提案する。時間的・空間的特徴の強い結合を実現することで、移動物体の認識精度を向上させる。
Abstract
本研究では、LiDARベースの3次元移動物体セグメンテーション手法「MambaMOS」を提案する。
まず、時間的情報と空間的情報の結合を強化するための手法「Time Clue Bootstrapping Embedding (TCBE)」を開発した。TCBEでは、時間情報の重要性を強調し、時間情報と空間情報の相互作用を高める。
次に、「Motion-aware State Space Model (MSSM)」を導入し、単一スキャンの外観特徴と複数スキャンの運動特徴の相互作用を深化させることで、時空間特徴の強い結合を実現した。
これらの手法により、MambaMOSは従来手法を大きく上回る移動物体セグメンテーション精度を達成した。特に遠距離の移動物体に対する認識精度が大幅に向上した。
また、別のデータセットでの評価でも優れた汎化性能を示した。
本研究は、ステート空間モデルをMOSタスクに適用した先駆的な取り組みであり、3次元ビジョンとNLPの接点を示唆するものである。
Stats
LiDARスキャンの時間的変化が移動物体の検出に重要である。
遠距離の移動物体に対する認識精度が大幅に向上した。
Quotes
"時間情報は移動物体検出の主要な手がかりであり、時間情報と空間情報の結合を強化することが移動物体の認識精度向上につながる。"
"単一スキャンの外観特徴と複数スキャンの運動特徴の相互作用を深化させることで、時空間特徴の強い結合を実現できる。"