本論文では、サンプリングベースのモデル予測制御(MPPI)の性能と信頼性を向上させるための新しい手法を提案している。従来のMPPIは、前回の最適入力系列をサンプリング分布の平均とするため、予期せぬ外乱や環境の急激な変化に対して脆弱であった。
提案手法では、クラシックなコントローラーや学習ベースのコントローラーなどのアンシラリーコントローラーを組み合わせることで、サンプリング分布をバイアス付けする。これにより、サンプリングの効率性、頑健性、収束性が向上する。
具体的には、逆転台車の振り上げ制御や複数エージェントの相互作用を伴う経路計画の実験を通して、提案手法の有効性を示している。提案手法は、従来のMPPIと比べて、より少ないサンプル数で優れた性能を発揮し、予期せぬ変化にも強靭であることが確認された。一方で、バイアスの導入により、時間的に遅い軌道を生成する可能性もある。
翻譯成其他語言
從原文內容
arxiv.org
深入探究