Core Concepts
データ駆動型のアプローチを用いて、未知の非線形システムの潜在状態を推定しながら、性能保証付きの最適入力軌道を計算する。
Abstract
本論文は、未知の非線形システムの最適制御問題を扱っている。システムの状態が直接観測できない場合、状態推定と動特性推定を同時に行う必要がある。この問題に対して、粒子マルコフ連鎖モンテカルロ法を用いて、システムの動特性と状態軌道の事後分布をサンプリングする。得られたサンプルを用いて、確率的な性能保証付きの最適制御問題を定式化し、解くことで、入力軌道を決定する。
具体的には以下の手順で進められる:
入出力データに基づいて、システムの動特性と状態軌道の事後分布をPMCMC法でサンプリングする。
得られたサンプルを用いて、コストを最小化しつつ制約を高確率で満たす最適入力軌道を求める。
理論的な性能保証を導出するために、サポートサブサンプルを特定し、その上で確率的な保証を導出する。
提案手法は、シミュレーションによって有効性が示されている。未知の基底関数を用いた場合でも良好な結果が得られることが確認された。本手法は、状態が直接観測できない複雑なシステムの最適制御に適用可能であり、安全性の高い制御系設計に貢献できると期待される。
Stats
状態遷移関数は未知であり、式(11)で表される。
状態遷移ノイズの分布は未知であり、式(12)で表される。
出力関数と観測ノイズの分布は既知である。
最適化の対象となるコスト関数は式(2)で表される。
制約条件は2 ≤ y20:25 および |u| ≤ 5 である。
Quotes
"データ駆動型のアプローチは、複雑なダイナミカルシステムに対する制御工学手法を適用する際に有望な代替手段として現れている。"
"状態が直接観測できない場合、動特性と潜在状態を同時に推定する必要があり、不確実性の定量化と形式的な性能保証を伴う制御器の設計がより困難になる。"