核心概念
速度に応じて最適なゲイトを自律的に選択することで、四足ロボットの安定した歩行と高いエネルギー効率を実現する。
要約
本研究では、四足ロボットの歩行制御に対して、速度に応じて適応的にエネルギー消費を最小化する報酬関数を提案した。この報酬関数を用いてANYmal-CとUnitree Go1の歩行を強化学習により最適化したところ、速度に応じて四歩行歩行やトロッティングなどの最適なゲイトを自律的に選択できることが示された。従来の複雑な報酬設計に比べ、本手法は単純な報酬設計ながら高いエネルギー効率と安定した速度追従性能を実現できた。シミュレーションでの検証に加え、Go1ロボットでの実機実験でも本手法の有効性が確認された。
統計
速度0.5 m/sでは四歩行歩行、速度1.0 m/sでは歩行とトロッティングの中間的なゲイト、速度2.0 m/sではトロッティングのゲイトを自律的に選択した。
低速時は足の接地高さを低く抑え、高速時は必要最小限の高さまで足を上げることで、エネルギー効率的な歩行を実現した。
引用
"速度に応じて最適なゲイトを自律的に選択することで、四足ロボットの安定した歩行と高いエネルギー効率を実現する。"
"本手法は単純な報酬設計ながら高いエネルギー効率と安定した速度追従性能を実現できた。"