Core Concepts
ライダーレイドロップノイズを正確にモデル化しながら、反復的なサンプリングの強みを維持するために、潜在空間でレンジイメージをサンプリングするAutoRegressiveトランスフォーマーを使用したジェネレーティブモデルLidarGRITを提案する。
Abstract
本論文では、ライダーポイントクラウド生成のための新しいジェネレーティブモデルLidarGRITを提案している。
まず、ライダーポイントクラウドをレンジイメージで表現する。次に、VQ-VAEエンコーダでレンジイメージをトークン化し、別々にクリーンなレンジイメージとレイドロップマスクを生成する。さらに、AutoRegressiveトランスフォーマーを使ってトークン間の相互作用をモデル化する。
この2段階のプロセスにより、反復的なサンプリングの利点を活かしつつ、レイドロップノイズの正確な生成を実現している。また、VQ-VAEモデルの過剰適合を防ぐために、幾何学的な保存を導入している。
提案手法LidarGRITは、KITTI-360およびKITTIオドメトリデータセットで最先端モデルを上回る性能を示している。特に、レンジイメージベースの評価指標SWDで大幅な改善が見られ、より現実的なレイドロップノイズの生成が可能となっている。
Stats
レンジイメージの範囲は0から1の間の値を持つ。
レイドロップマスクは0と1の2値を取る。