Centrala begrepp
SparseOccは、3D空間の疎な潜在表現を利用することで、効率的かつ正確な意味的占有予測を実現する。
Sammanfattning
本論文は、自動運転のための3D空間知覚において、効率的かつ正確な意味的占有予測手法を提案している。従来の手法は密な3D表現を用いていたが、計算コストが高く、情報の損失も大きかった。
本手法では、以下の3つの主要な設計要素を提案している:
疎な潜在拡散器 (Sparse Latent Diffuser)
非空の特徴を隣接する空の領域に伝播させ、シーンの完成を可能にする
3D畳み込みカーネルを直交的に分解することで効率化
疎なフィーチャーピラミッド (Sparse Feature Pyramid)
マルチスケールの疎な特徴を融合することで、受容野を拡大しつつ疎さを維持
疎なトランスフォーマーヘッド (Sparse Transformer Head)
非空の領域のみを対象とすることで、計算コストを大幅に削減
これらの設計により、SparseOccは従来手法に比べて大幅な計算コスト削減を実現しつつ、意味的占有予測の精度も向上させている。
Statistik
空の領域は全体の約67%を占める
SparseOccは従来手法に比べて、FLOPSを74.9%削減できる
Citat
"SparseOccは従来手法に比べて、FLOPSを74.9%削減できる"
"SparseOccは意味的占有予測の精度も向上させている"