Core Concepts
ディフューションモデルとトランスフォーマーを組み合わせた新しい手法を提案し、より現実的で多様な交通シーンを生成することができる。
Abstract
本論文では、自動運転のための新しい交通シーン生成モデルTSDiTを提案している。TSDiTは、ディフューションモデルとトランスフォーマーを組み合わせた手法である。
まず、ディフューションモデルを使って、過去の軌跡データから「アクション潜在変数」を生成する。これにより、エージェントの行動の多様性と不確定性を高めることができる。次に、この「アクション潜在変数」、過去の軌跡、HDマップ情報をトランスフォーマーのブロックに入力し、エージェントの特徴を抽出する。最後に、トラジェクトリデコーダを使って、未来の軌跡を生成する。
提案手法の特徴は以下の通り:
「世界中心モデル」を採用し、各エージェントを中心とした座標変換を行わずに、全体の交通シーン情報を入力できる。
ディフューションモデルを導入し、生成軌跡の多様性と不確定性を高めている。
トランスフォーマーを活用し、交通シーン内の複雑な相互作用をモデル化している。
実験結果から、提案手法は滑らかな曲線軌跡の生成に優れ、現実的で多様な交通シーンを生成できることが示された。自動運転システムの開発に貢献できる可能性がある。
Stats
交通シーンの生成において、提案手法のADEは0.684、FDEは1.792と良好な結果を示した。