본 연구에서는 편미분 방정식으로 표현되는 고차원 비선형 동적 시스템의 상태를 효율적으로 추정하기 위해 강화학습 기반의 축소 모델 추정기(RL-ROE)를 제안한다. RL-ROE는 축소 모델(ROM)을 기반으로 하며, 측정값을 활용하여 상태를 추정하는 비선형 정책을 강화학습을 통해 학습한다. 이를 통해 ROM의 오차를 효과적으로 보상할 수 있다.