Core Concepts
선형 2차 최적제어 문제에서 목적 함수가 CJS-PL 조건을 만족하면, 교란이 있는 경우에도 시스템이 작은 교란 입력-상태 안정성을 가진다.
Abstract
이 논문은 선형 2차 최적제어(LQR) 문제에 대한 교란에 대한 강건성을 분석한다.
먼저 일반적인 제약 최적화 문제에 대해 교란이 있는 경우 gradient flow가 작은 교란 입력-상태 안정성(small-disturbance ISS)을 가지기 위한 조건을 제시한다. 이를 위해 목적 함수가 CJS-PL(comparison just saturated Polyak-Lojasiewicz) 조건을 만족해야 함을 보인다.
이어서 LQR 문제에 대해 CJS-PL 조건이 성립함을 보이고, 이를 통해 표준 gradient flow, natural gradient flow, Newton gradient flow 등이 모두 작은 교란 입력-상태 안정성을 가짐을 보인다. 이는 LQR 문제에서 교란이 있는 경우에도 최적해에 수렴할 수 있음을 의미한다.
Stats
선형 2차 최적제어 문제에서 최적 제어 이득 K*는 Riccati 방정식의 해로 주어진다.
목적 함수 J2(K)의 gradient는 ∇J2(K) = 2(RK - BTPk)Yk로 주어진다.
목적 함수 J2(K)는 coercive하며, CJS-PL 조건을 만족한다.
Tr(Pk - P*) ≥ α4(||K - K*||F)이며, α4는 K∞-함수이다.
Quotes
"선형 2차 최적제어 문제에서 목적 함수가 CJS-PL 조건을 만족하면, 교란이 있는 경우에도 시스템이 작은 교란 입력-상태 안정성을 가진다."
"LQR 문제에서 표준 gradient flow, natural gradient flow, Newton gradient flow 등이 모두 작은 교란 입력-상태 안정성을 가진다."