Core Concepts
本論文では、従来の軌道計画手法の限界を示し、強化学習を用いた新しい軌道計画手法を提案する。提案手法は、相手車両との相互作用を明示的に活用することで、より積極的な追い越し動作を実現できる。
Abstract
本論文では、自律走行レーシングにおける対話型の追い越し動作の軌道計画について検討している。
まず、従来の軌道計画手法の問題点を示す。従来手法は、相手車両の予測と自車両の軌道計画を順次実行するが、相手車両が自車両の動きに反応する場合、予測の精度が低下する。このため、相互作用を考慮した新しい軌道計画手法が必要となる。
そこで本論文では、強化学習を用いた新しい軌道計画手法を提案する。従来手法とは異なり、終端状態を強化学習エージェントが直接選択することで、より多様な軌道を生成できる。評価の結果、提案手法は従来手法に比べ、特に相手車両の攻撃的な遮断行動に対して高い成功率を示すことが分かった。これは、相互作用を明示的に活用できるためである。
さらに、提案手法では、生成された軌道が実行不可能な場合に備えて、安全層を導入している。この安全層は、実行可能な軌道を生成することで、シナリオの失敗を防ぐ。
Stats
相手車両の遮断行動が激しい場合(sd = 40)、従来手法の成功率は30%程度であるのに対し、提案手法の成功率は92%に達する。
Quotes
"相手車両が自車両の動きに反応する場合、予測の精度が低下する。このため、相互作用を考慮した新しい軌道計画手法が必要となる。"
"提案手法は従来手法に比べ、特に相手車両の攻撃的な遮断行動に対して高い成功率を示す。これは、相互作用を明示的に活用できるためである。"