Core Concepts
強力なベースラインであるBEVFormerを基に、"occTransformer"という新しいソリューションが3D占有予測トラックでのパフォーマンスを向上させました。
Abstract
この技術レポートでは、CVPR 2023の自動運転チャレンジにおける3D占有予測トラックに対する私たちの解決策、「occTransformer」を紹介しています。データ拡張、強力な画像バックボーン、3D Unet Headの組み込み、損失関数の追加など、いくつかの効果的なテクニックを使用してモデルのパフォーマンスを向上させています。また、他のoccモデルとアンサンブル手法を組み合わせてパフォーマンスをさらに向上させました。最も重要なことは、3D検出モデルStreamPETRを統合し、シーン内のオブジェクトを検出する能力を高めたことです。これらの方法を使用して、私たちのソリューションは自律走行チャレンジで49.23 miouを達成しました。
Stats
Occ results on the testing set of nuScenes Dataset 3D Occupancy prediction track.
Our solution achieved 49.23 miou on the 3D occupancy prediction track in the autonomous driving challenge.
The dataset includes data from six cameras and has a voxel size of 0.4m.
The range of the dataset is from -40m to 40m in the x and y directions and from -1m to 5.4m in the z.
The volume size is [200, 200, 16].
Quotes
"We found that weighting the probabilities from different models is more effective than taking the maximum probability or using a voting approach to combine the predictions from different models."
"Our solution achieved 49.23 miou on the 3D occupancy prediction track in the autonomous driving challenge."