본 연구는 매개변수 편미분방정식(PDE) 제어를 위한 효율적이고 해석 가능한 심층 강화학습(DRL) 방법을 제안한다. 기존 DRL 방법은 DNN 기반 정책을 사용하지만, 이는 많은 학습 데이터와 계산량이 필요하고 일반화 및 해석 가능성이 낮다는 단점이 있다.
본 연구에서는 희소 다항식 정책을 사용하여 이러한 문제를 해결한다. 다항식 특징을 단일층 신경망에 입력하고, 미분 가능한 L0 정규화를 통해 희소성을 강제한다. 이를 통해 적은 수의 매개변수로도 복잡한 정책을 학습할 수 있다.
제안 방법은 Kuramoto-Sivashinsky(KS) PDE와 Convection-Diffusion-Reaction(CDR) PDE 제어 문제에 적용되었다. 실험 결과, 제안 방법은 기존 DNN 기반 DRL 정책에 비해 우수한 성능을 보였으며, 해석 가능한 다항식 제어 정책을 도출할 수 있었다. 또한 학습한 정책은 새로운 매개변수에 대해서도 일반화가 가능했다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor