المفاهيم الأساسية
Sennaは、大規模ビジョン言語モデル(LVLM)の高度なシーン理解能力と、End-to-Endモデルの正確な軌道予測能力を組み合わせることで、より安全で堅牢、かつ汎用性の高い自動運転を実現するシステムである。
الملخص
Senna:大規模ビジョン言語モデルとEnd-to-End自動運転の橋渡し
Bo Jiang, Shaoyu Chen, Bencheng Liao, Xingyu Zhang, Wei Yin, Qian Zhang, Chang Huang, Wenyu Liu, Xinggang Wang. (2024). Senna: Bridging Large Vision-Language Models and End-to-End Autonomous Driving. JOURNAL OF LATEX CLASS FILES, 14(8).
本研究は、大規模ビジョン言語モデル(LVLM)とEnd-to-End自動運転モデルを統合することで、複雑な状況下における自動運転の安全性、ロバスト性、および汎用性を向上させることを目的とする。