本稿では、深層学習を用いた人間らしい歩行動作生成と、モデルベース制御による動的な安定性確保を組み合わせた、新たなヒューマノイドロボットの歩行制御アーキテクチャを提案する。
予め定義された足場や圧力中心(CoP)軌道に依存しない、オンラインでのステップ調整が可能な、離散時間モデル予測制御(MPC)を用いたヒューマノイド歩行制御アプローチが提案されている。
事前学習と強化学習を組み合わせた新しい学習手法により、ヒューマノイドロボットは、急勾配、起伏の激しい、岩場などの困難な地形を自律的に歩行できるようになる。
Humanoid-Gymは、シミュレーションから実環境への完全なゼロショット転移を可能にする強化学習フレームワークである。