본 연구는 매개변수 편미분방정식 제어를 위해 희소 다항식 정책을 학습하는 데이터 효율적이고 강건하며 해석 가능한 방법을 제안한다. 이를 통해 복잡한 DNN 기반 정책에 비해 적은 수의 매개변수로도 우수한 성능을 달성할 수 있다.