核心概念
モデル予測制御(NMPC)とMonte Carlo Tree Search(MCTS)を組み合わせて、ステッピングストーンでの俊敏な移動のための効率的な制御ポリシーを設計する。
摘要
足脚ロボットは高度なダイナミックマニューバを実行できるようになったが、ステッピングストーンなどの高度に制約された環境での俊敏な移動はまだ課題です。この論文では、非線形モデル予測制御(NMPC)を使用して全身運動を生成し、Monte Carlo Tree Search(MCTS)を使用して最適な接触計画を効率的に探索します。MCTSとNMPCの組み合わせにより、数秒で特定の環境に対する適切な計画を素早く見つけることができます。しかし、これらは反応型ポリシーとしてはまだ適していません。そのため、特定のシーン向けに最適化された目標条件付きポリシーのデータセットを生成し、監督学習を通じてそれを学習します。提案されたフレームワークは四足歩行ロボットSolo12が高度に制約された環境で異なる目標地点へジャンプするシナリオでテストされました。
统计
NMPCとMCTSによって数秒以内に特定環境用の計画が見つかる。
MCTSは58個中94個の解決策を見つけることが可能。
ポリシーは70msで評価可能。
引用
"Legged robots have become capable of performing highly dynamic maneuvers in the past few years."
"We propose a combination of model-based control, search, and learning to design efficient control policies for agile locomotion on stepping stones."
"Our proposed framework on a scenario where our quadruped robot Solo12 successfully jumps to different goals in a highly constrained environment."