Kernekoncepter
著者は、接触の不確実性に対する頑健な足脚運動を向上させるための確率的/頑健な非線形モデル予測制御(NMPC)を提案しています。
Resumé
この論文では、接触の不確実性に対する頑健な足脚運動を向上させるための確率的/頑健なNMPCフレームワークが紹介されています。以下は内容の概要です:
イントロダクション
- ロボット工学における基本的課題は、環境との接触時に生じる不確実性に対する頑健性です。
- モデルフリー強化学習(RL)は、環境の不確実性を制御ポリシーに組み込む能力を提供します。
関連作業
- 確率的/頑健MPCは、系列全体で不確定要素を予測し、制約が満たされることを保証します。
- しかし、これらの研究では接触イベントに関連する不確定性を捉えることが難しいとされています。
貢献
- 接触イベントに関連する不確定性を考慮した新しいNMPCアプローチが提案されています。
- 提案手法は、接触イベント間で共分散伝播を行う新しい共分散更新方法も含んでいます。
アルゴリズム概要
- ゼロ次アルゴリズムと内点法が使用されており、効率的な計算戦略が導入されています。
- リカッティ再帰法が使用されており、ニュートンステップの計算やフィードバックゲインのオンライン更新が可能です。
実験結果
- シミュレーションと実機実験では、提案手法が他のMPC手法よりも優れた結果を示しています。
- 実機実験では、提案手法がTachyon 3の知覚運動で成功裏に階段昇降や移動操作を行っています。
Statistik
このセンテンスに重要な数字やメトリクスはありません。
Citater
"Model-free reinforcement learning offers the ability to incorporate various environmental uncertainties into control policies."
"Stochastic/robust MPC predicts the uncertainties in the system state over the horizon and tightens constraints to ensure that the constraints are satisfied even in the presence of disturbances."