本研究では、動的な交通環境における自律走行車の安全な意思決定のために、深層注意駆動強化学習(DAD-RL)フレームワークを提案している。
DAD-RLフレームワークの主な特徴は以下の通りである:
自律走行車中心の時空間的注意メカニズムを導入し、周辺車両との動的な相互作用を学習する。自律走行車の注意ベクトルが周辺車両の特徴ベクトルに動的に注目する。
経路情報を抽出するためのコンテキストエンコーダを開発し、時空間的注意エンコーディングと組み合わせることで、強化学習のための包括的な状態表現を得る。
安全性と効率性を考慮した報酬関数を設計する。
実験の結果、提案手法であるDAD-RLは、最新のトランスフォーマーベースのモデルと比較して、成功率、衝突率、停滞率の面で優れた性能を示す。また、人間らしい運転行動に関する指標と総合スコアの観点から、コンテキストエンコーディングと時空間的注意メカニズムの重要性が確認された。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Jayabrata Ch... kl. arxiv.org 10-01-2024
https://arxiv.org/pdf/2407.08932.pdfDybere Forespørgsler