핵심 개념
DriveDreamer-2は、ユーザー定義の運転ビデオを生成する世界モデルです。
초록
DriveDreamer-2は、LLMを活用してユーザークエリを前景エージェント軌跡に変換し、HDMapジェネレーターを使用して背景交通条件を生成します。
ユニファイドマルチビューモデル(UniMVM)が導入されており、多視点の運転ビデオの一貫性を向上させています。
実験結果は、DriveDreamer-2が他の最先端手法よりも高品質なビデオ生成能力を持っていることを示しています。
통계
生成されたビデオの品質評価においてFIDとFVDスコアが11.2と55.7であることが示されています。