Centrala begrepp
MultiCorruptは、LiDARとカメラのデータに10種類の障害を加えることで、マルチモーダル3D物体検出モデルの頑健性を包括的に評価する。
Sammanfattning
本研究では、MultiCorruptと呼ばれる新しいベンチマークを提案している。MultiCorruptは、LiDARとカメラのデータに10種類の障害(暗闇、明るさ、ポイント減少、時間的ずれ、空間的ずれ、モーションブラー、カメラ欠損、ビーム減少、霧、雪)を加えることで、マルチモーダル3D物体検出モデルの頑健性を包括的に評価する。
5つの最新のマルチモーダル検出モデルを評価した結果、以下のような知見が得られた:
- CMTが最も頑健性が高く、SparseFusionが次に優れている。一方、TransFusionとDeepInteractionは頑健性が低い。
- 独立したモダリティ処理や、マスクされたモーダリティ学習が頑健性を高める要因となる。一方、単一モダリティに依存した初期化や、早期の深い融合は頑健性を低下させる。
本ベンチマークは、マルチモーダル3D物体検出の頑健性研究に有用な基盤を提供する。
Statistik
暗闇の影響で、検出精度が最大で約50%低下する。
雪の影響で、検出精度が最大で約45%低下する。
空間的ずれの影響で、検出精度が最大で約30%低下する。
Citat
"マルチモーダル3D物体検出モデルの頑健性は、センサーの整合性や環境条件に大きく依存する。"
"独立したモダリティ処理や、マスクされたモーダリティ学習が頑健性を高める要因となる。"
"単一モダリティに依存した初期化や、早期の深い融合は頑健性を低下させる。"