본 논문은 모델 예측 제어(MPC)에서 영감을 받아 새로운 매개변수화된 제어기를 제안한다. 이 제어기는 선형 MPC 문제의 2차 계획법 솔버와 유사한 구조를 가지지만, 시스템 모델에서 유도되는 대신 심층 강화학습을 통해 매개변수가 학습된다. 이를 통해 일반적인 신경망 기반 제어기에 비해 검증 가능성과 성능 보장을 얻을 수 있다.