מושגי ליבה
연속시간 선형-2차 최적제어 문제를 이산화하기 위한 수치적 방법을 제안한다. 이를 위해 미분방정식 시스템을 도입하고, 이를 해결하는 세 가지 수치적 방법을 제시한다. 또한 확률적 선형-2차 최적제어 문제의 비용 함수 분포를 분석한다.
תקציר
이 논문에서는 연속시간 선형-2차 최적제어 문제(LQ-OCP)의 이산화를 위한 수치적 방법을 소개한다.
먼저 결정론적 LQ-OCP와 확률적 LQ-OCP를 정의하고, 이를 이산화하기 위한 미분방정식 시스템을 제안한다.
다음으로 세 가지 수치적 방법을 제시한다:
- 상미분방정식(ODE) 방법: 고정 시간 간격 ODE 방법을 사용하여 미분방정식 시스템을 해결한다.
- 행렬지수 방법: 행렬지수 문제를 풀어 미분방정식 시스템을 해결한다.
- 단계 배가 방법: 단계 배가 알고리즘을 사용하여 효율적으로 미분방정식 시스템을 해결한다.
마지막으로, 확률적 LQ-OCP의 비용 함수 분포를 분석한다. Euler-Maruyama 이산화를 사용하여 비용 함수를 2차 형식으로 재구성하고, 이 비용 함수가 일반화된 카이제곱 분포를 따르는 것을 보인다.
수치 실험을 통해 제안된 방법들의 성능을 비교하였다. 결과는 제안된 수치 방법들이 원래 문제와 동등한 이산화된 LQ-OCP를 생성한다는 것을 보여준다.
סטטיסטיקה
연속시간 LQ-OCP의 시스템 행렬:
Ac = [-49 24; -64 31]
Bc = [2 0.5; 1 3]
Gc = [0.1 0; 0 0.1]
Cc = [1.0 1.0]
Dc = [0.0 0.0]
초기 상태 공분산: P0 = diag([0.1 0.1])
샘플링 시간: Ts = 1.0