본 연구는 매개변수 편미분방정식 제어를 위해 희소 다항식 정책을 학습하는 데이터 효율적이고 강건하며 해석 가능한 방법을 제안한다. 이를 통해 복잡한 DNN 기반 정책에 비해 적은 수의 매개변수로도 우수한 성능을 달성할 수 있다.


coremsg

매개변수-편미분방정식-제어를-위한-심층-강화학습-및-미분-가능한-l0-희소-다항식-정책


매개변수 편미분방정식 제어를 위한 심층 강화학습 및 미분 가능한 L0-희소 다항식 정책