본 논문은 강화 학습 기반 제어 시스템의 안정성을 보장하는 프레임워크를 제안한다. 이를 위해 Youla-Kučera 매개변수화를 활용하여 안정적인 제어기를 학습할 수 있는 방법을 제시한다.