Die Studie führt einen umfassenden Benchmark namens "MultiCorrupt" ein, der speziell für die Bewertung der Robustheit von multisensorischen 3D-Objekterkennungsmodellen entwickelt wurde. Zehn verschiedene Arten von Datenkorruptionen, die sowohl LiDAR- als auch Kamerasensoren betreffen, werden simuliert, um die Leistung von fünf state-of-the-art Multisensor-Detektoren zu untersuchen.
Die Ergebnisse zeigen, dass die bestehenden Methoden je nach Art der Korruption und ihrer Fusionsstrategie unterschiedliche Grade an Robustheit aufweisen. Modelle, die unabhängige Verarbeitungspfade für die einzelnen Sensoren verwenden und eine asymmetrische Fusion nutzen, erweisen sich als robuster gegenüber Datenkorruptionen als Methoden, die eine starke Kopplung der Modalitäten in frühen Verarbeitungsstufen aufweisen. Darüber hinaus scheint das Trainieren mit fehlenden Modalitäten die Robustheit zu erhöhen. Der vorgestellte Benchmark dient als wichtiges Werkzeug, um die Fortschritte in Bezug auf die Robustheit von Multisensor-Objekterkennungsmodellen zu verfolgen und zu fördern.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문