ProFusion3Dは、中間特徴レベルとオブジェクトクエリレベルの両方で、鳥瞰図(BEV)と透視図(PV)の両方で特徴を融合する段階的融合フレームワークと、自己教師ありマスクモデリング事前トレーニング戦略を採用することで、LiDARとカメラの融合による3Dオブジェクト検出の精度とロバスト性を向上させる。
深層学習アルゴリズムの性能に影響を与えるドメインシフトに焦点を当てた大規模なデータセットの導入。