Core Concepts
본 논문에서는 연속 시간 및 공간 상의 확률적 최적 제어 문제를 다룬다. 이를 위해 이중 앙상블 칼만 필터(dual ensemble Kalman filter, 이하 dual EnKF)라는 시뮬레이션 기반 알고리즘을 제안한다. 이 알고리즘은 최적 제어 문제를 확률 밀도 함수 추정 문제로 변환하여 해결한다.
Abstract
본 논문은 확률적 최적 제어 문제를 다룬다. 구체적으로 다음과 같은 내용을 다룬다:
확률적 최적 제어(Stochastic Optimal Control, SOC) 문제와 위험 민감 제어(Risk Sensitive Control, RSC) 문제를 정의한다. 이 문제들은 연속 시간 및 공간 상에서 고려된다.
최적 제어 문제를 확률 밀도 함수 추정 문제로 변환하는 방법을 제안한다. 이를 위해 최적 가치 함수와 확률 밀도 함수 간의 관계를 정립한다.
변환된 문제를 해결하기 위해 이중 앙상블 칼만 필터(dual EnKF)라는 시뮬레이션 기반 알고리즘을 제안한다. 이 알고리즘은 상호작용하는 입자 시스템을 통해 최적 제어 정책을 근사한다.
선형 가우시안 최적 제어 문제에 대한 특별한 경우를 다룬다. 이 경우 알고리즘이 단순화되며, 가우시안 근사 기법을 활용할 수 있다.
제안된 알고리즘을 역진자 시스템과 스프링-질량-댐퍼 시스템에 적용하여 성능을 확인한다.
Stats
역진자 시스템의 경우 목표 상태는 x = 0, θ = π이다.
스프링-질량-댐퍼 시스템의 경우 ARE(Algebraic Riccati Equation) 해와 EnKF 알고리즘 출력 간 수렴을 확인하였다.