OccGenは、ノイズから占有マップを段階的に推論・精緻化する生成型モデルであり、従来の識別型モデルよりも優れた性能と柔軟性を示す。
投影行列を利用して効率的に3DフィーチャーボリュームとグローバルBEVフィーチャーを生成し、それらを融合することで高精度な3D占有予測を実現する。
時間的な視差情報を活用することで、3D セマンティック占有予測の精度を大幅に向上させることができる。