Core Concepts
線形制約付きオンラインLQG問題における新しいアルゴリズムOONMの性能を示す。
Abstract
I. 概要
オンライン最適化と制御の進歩により、オンライン線形二次レギュレータ(LQR)問題が研究されている。
既存の作品では、オンラインコントローラは通常、状態または過去のノイズの線形関数としてパラメータ化される。
II. 関連作品
オフラインLQR問題に対する方策最適化について勾配ベース手法の収束特性が研究されている。
III. 問題設定
完全観測可能なLTIシステムを考え、与えられた線形制約を満たす一連の線形コントローラ{Kt}を学ぶ。
IV. アルゴリズムと理論的結果
OONMアルゴリズムは、Riemannianメトリックに基づく第2次アプローチであり、予測されたコスト関数情報を使用して学習中にコントローラを調整する。
V. 数値実験
OONMは他の手法よりも優れた性能を示し、Riemannian接続から派生したメトリックと未来のコスト関数予測が性能向上に寄与していることが確認された。
VI. 結論
線形制約付きオンラインLQG問題におけるOONMアルゴリズムは動的後悔境界を提供し、シミュレーション結果でその優越性が示された。
Stats
「OONM」アルゴリズムは他手法よりも優れた性能を示す。