핵심 개념
유한 시간 선형-제곱 제어 문제에 대한 정책 그래디언트 방법의 전역 선형 수렴을 연구함.
초록
글로벌 선형 수렴을 위한 정책 그래디언트 방법 연구
연구는 유한 시간 선형-제곱 제어 문제에 초점
연속 시간 가우시안 정책의 평균과 공분산에 대한 기하학적 그래디언트 하강 제안
이산 시간 정책에 대한 새로운 정책 그래디언트 방법 제안
수치 실험을 통해 제안된 알고리즘의 수렴성과 견고성 확인
이산 시간 정책에서 메쉬 독립적인 선형 수렴성에 대한 분석