本論文では、3D セマンティック占有予測のための新しい生成型モデル「OccGen」を提案している。従来の識別型モデルは、入力と出力の単一マッピングを学習するのに対し、OccGenは「ノイズから占有」へと段階的に推論・精緻化するアプローチを採用している。
OccGenの主な特徴は以下の通り:
実験では、nuScenes-Occupancy、SemanticKITTIデータセットにおいて、従来手法を上回る性能を示した。特に、nuScenes-Occupancyでは、マルチモーダル入力時に9.5%、LiDARのみ6.3%、カメラのみ13.3%のmIoU改善を達成した。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Guoqing Wang... a las arxiv.org 04-24-2024
https://arxiv.org/pdf/2404.15014.pdfConsultas más profundas