核心概念
本論文では、PAC-Bayesの理論を活用して、確率論的非線形最適制御問題に対する一般化誤差界を導出する。この界を用いて、事前知識を組み込むことができる新しい制御器設計手法を提案する。また、安定性を保証するための手法と組み合わせることで、安定性を備えた制御器を設計できる。
摘要
本論文では、確率論的非線形最適制御(SNOC)問題を扱う。SNOCでは、非線形システムの動特性に影響する不確定性を平均化した費用関数を最小化する。実用上の理由から、この問題は有限のデータセットに基づく経験的な費用関数の最小化として扱われる。しかし、この手法では、訓練データ外の不確定性に対する制御性能の保証が課題となる。特に、訓練データが少ない場合、SNOCの方策は過学習に陥りやすく、経験的な費用と真の費用の間に大きな差が生じる可能性がある。
そこで本論文では、PAC-Bayesの理論を活用して、真の費用を経験的な費用で上界評価する手法を提案する。この上界評価式に基づき、事前知識を組み込むことができる新しい制御器設計手法を提案する。さらに、非線形システムの安定化制御器の最近の表現手法と組み合わせることで、閉ループ安定性を保証する。
提案手法の有効性は、協調ロボティクスの課題において、事前知識の組み込みと過学習の回避を示すことで確認される。
統計資料
システムの初期状態の公称値は¯
x = 2である。
ノイズの平均値は µw = 0.3、分散は σ2
w = 0.09である。
ステージ費用関数は lLQ(xt, ut) = 5x2
t + 0.003u2
tである。