本論文では、サンプリングベースのモデル予測制御(MPPI)の性能と信頼性を向上させるための新しい手法を提案している。従来のMPPIは、前回の最適入力系列をサンプリング分布の平均とするため、予期せぬ外乱や環境の急激な変化に対して脆弱であった。
提案手法では、クラシックなコントローラーや学習ベースのコントローラーなどのアンシラリーコントローラーを組み合わせることで、サンプリング分布をバイアス付けする。これにより、サンプリングの効率性、頑健性、収束性が向上する。
具体的には、逆転台車の振り上げ制御や複数エージェントの相互作用を伴う経路計画の実験を通して、提案手法の有効性を示している。提案手法は、従来のMPPIと比べて、より少ないサンプル数で優れた性能を発揮し、予期せぬ変化にも強靭であることが確認された。一方で、バイアスの導入により、時間的に遅い軌道を生成する可能性もある。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문