UniSceneは、多視点カメラ入力から3Dシーンの幾何学的占有率を再構築することで、自動運転のための多視点カメラ知覚モデルの事前学習を行う。これにより、空間的・時間的相関を効果的に活用し、3D物体検出や意味的シーン完成などの下流タスクの性能を大幅に向上させることができる。