Konsep Inti
불확실한 선형 시변 확률 시스템의 제어를 위해 시나리오 최적화 기반의 후회 최소화 접근법을 제안한다. 이를 통해 사전에 알려지지 않은 시스템 동역학에 대해 강건한 성능 보장과 안전 제약 만족을 달성할 수 있다.
Abstrak
이 논문은 불확실한 선형 시변 확률 시스템의 제어 문제를 다룬다. 기존의 H2 및 H∞ 제어와 달리, 이 접근법은 적대적으로 선택된 교란에 대해서도 성능 보장을 제공한다.
핵심 내용은 다음과 같다:
- 시나리오 최적화 기반의 후회 최소화 문제를 정의한다. 이는 사전에 알려지지 않은 시스템 동역학에 대해 강건한 성능 보장과 안전 제약 만족을 달성한다.
- 제안된 문제를 반한한정 계획법으로 풀 수 있음을 보인다. 이를 통해 효율적인 계산이 가능하다.
- 시나리오 최적화의 일반화 능력을 활용하여, 무시할 수 있는 작은 확률로만 제약을 위반하는 제어 정책을 합성할 수 있음을 보인다.
- 수치 실험을 통해 제안된 접근법이 기존의 H∞ 기반 접근법에 비해 보수성을 완화할 수 있음을 보인다.
Statistik
불확실한 선형 시변 시스템의 상태 방정식은 xt+1 = At(θt)xt + Bt(θt)ut + Et(θt)wt 로 주어진다.
제어 비용은 x⊤Qx + u⊤Ru 로 정의된다.
안전 제약은 Hx(θ)x + Hu(θ)u ≤ h(θ) 로 주어진다.
교란 집합은 W(θ) = {w : w = Hw(θ)d , ∥d∥2 ≤ 1} 로 정의된다.
Kutipan
"Differently from the stochastic and worst-case assumptions typical of H2 and H∞ controllers, algorithms with provable regret certificates offer attractive performance guarantees that hold independently of how disturbances are generated."
"A key challenge lies in handling the different impacts that parametric uncertainty has on the closed-loop behavior achieved by the clairvoyant benchmark policy, on the one hand, and by the causal controller to be designed on the other."
"Motivated as above, we show how convex optimization and sampling techniques can be used to synthesize a disturbance feedback robust control policy with provable regret guarantees in spite of the uncertain dynamics."