本論文では、過酷な環境下でも安定したホッピングを実現するための制御手法を提案している。
具体的には、アクチュエータ化できない自由度の動きを最適制御を用いて学習し、その学習結果に基づいて制御を行う「学習ゼロダイナミクスポリシー」と呼ばれる手法を開発した。
この手法では、まず最適制御問題を解いて、アクチュエータ化できない自由度の動きに対する最適な入力を求める。次に、その最適入力に基づいて、アクチュエータ化できる自由度の動きを生成するマッピングを学習する。
このマッピングを用いて制御を行うことで、最適性と安定性を両立した制御が可能となる。
提案手法をARCHER 3Dホッピングロボットに適用した結果、3000回以上のホッピングを安定して実現できることを示した。
ロバスト性、敏捷性、障害物通過能力など、優れた性能を発揮することが確認された。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問