本研究は、高品質な運転ビデオ生成のための重要な課題である、カメラ動作の制御と多視点間の一貫性を同時に解決することを目的としている。
具体的には以下の取り組みを行っている:
カメラパラメータをプリューカー座標系で表現し、既存の生成モデルに効果的に組み込むことで、カメラ動作の制御性を向上させている。
隣接カメラ間の幾何学的関係を利用したクロスアテンション機構を導入し、多視点間の空間的一貫性を高めている。
実験結果から、提案手法であるMyGoは、一般的なカメラ制御ビデオ生成と多視点運転ビデオ生成の両方で最先端の性能を達成していることが示された。これにより、自動運転システムにおける環境シミュレーションの精度向上に貢献できると期待される。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yining Yao, ... kl. arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06189.pdfDybere Forespørgsler