本論文では、自律走行レーシングにおける対話型の追い越し動作の軌道計画について検討している。
まず、従来の軌道計画手法の問題点を示す。従来手法は、相手車両の予測と自車両の軌道計画を順次実行するが、相手車両が自車両の動きに反応する場合、予測の精度が低下する。このため、相互作用を考慮した新しい軌道計画手法が必要となる。
そこで本論文では、強化学習を用いた新しい軌道計画手法を提案する。従来手法とは異なり、終端状態を強化学習エージェントが直接選択することで、より多様な軌道を生成できる。評価の結果、提案手法は従来手法に比べ、特に相手車両の攻撃的な遮断行動に対して高い成功率を示すことが分かった。これは、相互作用を明示的に活用できるためである。
さらに、提案手法では、生成された軌道が実行不可能な場合に備えて、安全層を導入している。この安全層は、実行可能な軌道を生成することで、シナリオの失敗を防ぐ。
toiselle kielelle
lähdeaineistosta
arxiv.org
Syvällisempiä Kysymyksiä