Core Concepts
確率的リスク制約を考慮した最適制御設計に焦点を当てる。
Abstract
CDC 2024に提出された論文で、確率的リスクまたはチャンス制約を考慮した無限期間平均期待二次コストを最小化するモデルフリー最適制御設計が調査されている。
線形時不変システムにおいて、線形状態フィードバック制御のクラス内で最適なコントローラが設計されている。
ポリシーグラディエント(PG)ベースのアルゴリズムであるNPG、GNPG、DDPGが開発され、数値シミュレーションを通じて比較されている。
NPGおよびGNPGアルゴリズムの収束特性と精度が数値的に比較されている。
NPGおよびGNPGアルゴリズムの収束特性と安定性が分析されている。DDPGアルゴリズムの収束特性とNPGおよびGNPGアルゴリズムの収束特性は未知モデルシナリオでは今後の研究課題として残っている。
Stats
Jc(K) ≤δ の条件下でλ∗ < ∞ が存在することが示されている。
K∗(λ) および Jc(K∗(λ)) は λ の連続関数であることが示唆されている。
Quotes
"The designed controller will lower the control cost if we constrain the probability of risky or undesirable events instead of imposing hard constraints."
"Controllers designed with hard constraints are pessimistic compared to the ones designed with softer probabilistic constraints."