本研究では、自動運転車(CAV)と人間運転車(HDV)が混在する交通環境において、効率的かつ安全な協調的な意思決定を実現するためのフレームワークを提案している。
具体的には以下の取り組みを行っている:
強化学習アルゴリズムDQNを基盤とし、トランスフォーマーエンコーダを組み込んだSPformerアーキテクチャを提案した。これにより、車両間の相互作用を効果的に抽出することができる。
学習の媒体として可学習なポリシートークンを導入し、車両の物理的位置情報をエンコーディングする手法を提案した。これにより、車両の位置情報を強化し、意思決定の質を向上させている。
オンランプ合流シナリオにおいて、SPformerの性能を検証した。その結果、従来のCNNやGNNベースの手法と比較して、学習効率と最終的な意思決定の質が大幅に向上していることが示された。
以上のように、本研究はトランスフォーマーを活用した新しい協調的意思決定手法を提案し、その有効性を実証したものである。今後は、より複雑な交通環境における性能向上や、ゲーム理論やMCTSなどとの組み合わせによる高度化が期待される。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Ye Han, Liju... at arxiv.org 09-24-2024
https://arxiv.org/pdf/2409.15105.pdfDeeper Inquiries