Centrala begrepp
メタ学習アプローチ「Portfolio」を用いることで、AutoMPCのシステム同定チューニングの効率と安定性が向上する。
Sammanfattning
本研究では、データ駆動型モデル予測制御(MPC)の自動チューニングを効率的に行うために、メタ学習アプローチ「Portfolio」を提案している。
AutoMPCは、Bayesian最適化(BO)を用いてMPCのハイパーパラメータを自動調整するが、ランダムな初期化から始めるため、探索が非効率的で不安定になる問題がある。
Portfolioは、過去のタスクから得られた信頼できる設定を利用して、BOの初期化を最適化する。これにより、新しいタスクに対してより迅速に適応し、限られた計算リソース内で望ましい解を見つけることができる。
実験では、11種類の非線形制御シミュレーションベンチマークと1つの物理的な水中ソフトロボットデータセットを用いて、Portfolioがpure BOよりも効率的かつ安定的にシステム同定チューニングを行えることを示した。さらに、Portfolioで得られた優れたモデルを用いることで、制御性能も向上することが確認された。
Statistik
100回のチューニング中、Portfolioは純BOよりも早く収束し、より良い性能を達成できる。
例えば、Walker2dSmallモデルのRMSEを13以下に抑えるのに、Portfolioは20回のチューニングで達成できるのに対し、純BOは40回必要とした。
HopperGravityOneAndHalfでは、Portfolioは5回のチューニングでスコア0.875以下を達成できたが、純BOは100回のチューニングでも達成できなかった。
Citat
"Portfolio allows AutoMPC to adjust to new tasks rapidly, similar to how it warms up the AutoML system."
"By replacing the random initialization of pure BO with a method which leverages prior knowledge, Portfolio improves the stability and effectiveness of the tuning process."