核心概念
MIM4D proposes a novel pre-training paradigm based on dual masked image modeling (MIM) for autonomous driving representation learning, achieving state-of-the-art performance on the nuScenes dataset.
統計
MIM4DはnuScenesデータセットで最先端のパフォーマンスを達成しました。
MIM4DはBEVセグメンテーションで8.7%のIoU向上を実現しました。
MIM4Dは3.5%のmAP向上を達成した3Dオブジェクト検出タスクでPETRとBEVDet4Dを超えました。