核心概念
競争的な走行シナリオでは、自己の先頭位置を維持するために、追い抜こうとする相手ロボットの動きを予測し、最適な軌道を選択する必要がある。
要約
本研究では、競争的な走行シナリオにおいて、自己の先頭位置を維持するための意思決定アプローチを提案している。
まず、ロボットの軌道候補と報酬行列を構築する。次に、レベルK推論フレームワークに基づいて、計画期間にわたる累積報酬を最大化する最適な軌道を決定する。特に、相手ロボットのレベルを過去の行動から オンラインで推定し、自己ロボットの軌道を決定する。
相手ロボットのレベルや戦略が意思決定プロセス中に変化する可能性を考慮し、レベルK最適軌道とフェールセーフ軌道を組み合わせる軌道混合戦略を導入する。
提案手法は、シミュレーションおよびヒューマンインザループ実験により評価され、従来のレベルK手法に比べて、相手ロボットの追い抜き阻止成功率が高いことが示された。
統計
自己ロボットの最高速度は0.6 m/sに制限されている
相手ロボットの最高速度は0.61 m/sに制限されている