本論文では、非線形動的システムの定常状態を最適化するためのグレーボックスフィードバック最適化手法を提案している。
まず、システムの入出力特性を表す定常状態マップと、非凸な目的関数からなる最適化問題を定式化する。
次に、提案するグレーボックスコントローラは、近似感度を利用した勾配情報と、モデルフリーの勾配推定を適応的に組み合わせて入力を更新する。近似感度の精度に応じて、モデルベースとモデルフリーの更新の重み付けを調整する。
理論的には、近似感度の精度に応じた条件を明らかにし、提案手法がモデルベースやモデルフリーのアプローチよりも優れた性能を発揮できることを示す。具体的には、近似感度の誤差が一定以下であれば、モデルベースアプローチより優れた収束特性が得られ、誤差が大きい場合でも、モデルフリーアプローチよりも効率的な探索が可能となる。
さらに、時変の目的関数や制約条件を持つ問題にも拡張し、動的レグレットや追跡誤差の観点から性能を評価している。提案手法は、近似感度の精度に応じて適応的に振る舞い、優れたサンプル効率と追跡性能を両立できることを示している。
To Another Language
from source content
arxiv.org
Deeper Inquiries