Core Concepts
알고리즘을 사용하여 안정적인 비선형 시스템에 대한 최적 Q-함수 근사화
Abstract
최적 제어 문제에 대한 동적 프로그래밍
비선형 시스템의 안정성과 수렴성
두 층 신경망 근사화
알고리즘 수렴성 및 최적 파라미터 근접성
실험 결과 및 성능 평가
Stats
표 1: 초기 상태에 따른 훈련된 신경망의 성능
표 2: 알고리즘 1의 최적화 문제
Quotes
"우리의 주요 기여는 최적 Q-함수에 대한 두 층 신경망 근사화를 찾기 위해 볼록 최적화를 주기적으로 사용하는 알고리즘을 소개하는 것입니다."
"알고리즘은 최적 신경망 매개변수가 안정적인 비선형 시스템에 대해 수렴하고 최적 신경망 매개변수와의 거리가 제한된다는 것을 보여줍니다."