本研究は、自動運転の進歩には大規模な注釈付きデータセットが不可欠であるという課題に取り組んでいる。生成モデルを活用して無尽蔵の合成データを生成する可能性に着目し、SubjectDrive というフレームワークを提案した。
SubjectDrive の特徴は、主体制御機能を導入し、外部データソースから多様な主体情報を取り入れることで、生成データの多様性を大幅に高めたことにある。具体的には、主体プロンプトアダプタ、主体ビジュアルアダプタ、拡張時間注意機構の3つの革新的なモジュールを開発し、主体の外観や位置情報を効果的に生成プロセスに組み込んでいる。
実験の結果、SubjectDrive は従来手法を大きく上回る性能を示し、生成データの量を増やすことで、実際のデータを使った事前学習モデルを凌駕する性能を達成できることを明らかにした。これは、生成データを活用して自動運転技術を飛躍的に進歩させる可能性を示唆するものである。
翻譯成其他語言
從原文內容
arxiv.org
深入探究