本研究では、強化学習を用いたロボット動作計画手法を提案している。RoboCup Small Size League (SSL)は、高度に動的な環境での多ロボット協調制御の問題に取り組む競技である。動作計画は、ロボットの動作モデルに合わせて最適化された経路を生成することが重要である。
提案手法では、ゴールを条件とした方策を学習し、オムニディレクショナルな動作制御を用いて、サブゴールを実行する。これにより、シミュレーション環境からリアルワールドへの移行が容易になる。
実験では、ベースラインとなる手法と提案手法を比較した。提案手法は、障害物のない環境で60%の時間短縮を達成し、動的障害物回避能力も示した。これらの結果は、強化学習がSSL環境における動作計画に有効であることを示している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問