본 논문은 강화 학습 기반 제어 시스템의 안정성을 보장하는 프레임워크를 제안한다. 주요 내용은 다음과 같다:
Youla-Kučera 매개변수화를 활용하여 안정적인 제어기를 학습할 수 있는 방법을 제시한다. 이를 위해 Willems의 기본 정리를 활용하여 데이터 기반의 내부 모델을 구축한다.
노이즈가 있는 Hankel 행렬 시스템의 안정성을 분석하고, 이를 통해 안정적인 예측이 가능함을 보인다.
선형 및 비선형 안정적 연산자를 학습하는 방법을 제안한다. 이를 통해 강화 학습 에이전트가 안정성을 보장하면서 제어기를 최적화할 수 있다.
고정 구조 제어기의 튜닝에도 이 프레임워크를 적용할 수 있음을 보인다.
이 프레임워크를 통해 강화 학습 기반 제어 시스템의 안정성을 보장하면서도 최적화 성능을 달성할 수 있다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문