強化学習は、動的で予測不可能なRoboCup Small Size League環境における、ロボットの動作計画に有効である。
ジャーク制限を考慮した時間最適軌道計画手法を提案し、ピーク電力の低減、エネルギー効率の向上、および追従性能の改善を実証する。
線形システムモデルのコントロールリアプノフ関数を使ってコントローラとその到達可能領域を計算し、非線形モデルのハミルトン・ヤコビ到達可能性解析を組み合わせることで、最悪ケースの外乱に対するロバストな制御を実現する。
ガウス過程(GP)とモデル予測制御(MPC)を統合することで、複雑なシステムの制御性能と信頼性を向上させることができる。
低周波サンプリング手法を用いることで、より滑らかで探索的な制御入力を生成できる。これにより、様々な応答速度を持つシステムで優れた、もしくは同等のパフォーマンスを示すことができる。
提案するSR-Fフレームワークは、オフラインで計算したロバストコントロールリアプノフ値関数を用いて、予期せぬ外乱が発生した際にも追跡器が計画器に確実に収束するよう保証する。さらに、この収束特性を利用して、安全を維持しつつ経路を加速することができる。
本研究では、ロボット双腕操作における同時衝突を伴う動作の追従制御を実現するための参照拡張制御フレームワークを提案する。このフレームワークでは、衝突前後の参照を一貫して定義し、衝突時の速度ジャンプに起因する入力のピークや不連続性を回避する。
提案するDecAP(Decaying Action Priors)フレームワークは、位置ベースの学習の効率性を活用して、トルク空間での学習を大幅に高速化する。これにより、トルク制御ポリシーが高品質な歩容を短時間で獲得し、外乱に対する頑健性を発揮する。
物理的事前知識を活用することで、データ効率性、説明可能性、安全性を向上させることができる。
動的把握には複数のサブモジュールが必要で、それぞれのメタパラメータを動的に制御することで、把握成功率を向上させ、把握時間を短縮できる。