Core Concepts
데이터 기반 대리 모델은 경제 비선형 모델 예측 제어의 계산 부담을 줄일 수 있지만, 시스템 식별 기반 모델은 제어 성능이 최적이지 않다. 이 연구에서는 강화 학습을 통해 제어 성능 최적화를 위한 쿠프만 대리 모델의 엔드-투-엔드 학습 방법을 제안한다.
Abstract
이 연구는 경제 비선형 모델 예측 제어(eNMPC)를 위한 쿠프만 대리 모델의 엔드-투-엔드 강화 학습 방법을 제안한다.
데이터 기반 대리 모델은 eNMPC의 계산 부담을 줄일 수 있지만, 시스템 식별 기반 모델은 제어 성능이 최적이지 않다.
강화 학습을 통해 제어 성능 최적화를 위한 쿠프만 대리 모델의 엔드-투-엔드 학습 방법을 제안한다.
연속 교반 탱크 반응기(CSTR) 모델을 기반으로 두 가지 사례 연구(NMPC, eNMPC)를 수행한다.
엔드-투-엔드 학습 쿠프만 모델이 시스템 식별 기반 모델보다 우수한 제어 성능을 보인다.
엔드-투-엔드 학습 쿠프만 MPC는 제어 설정 변경에 대해 재학습 없이 적응할 수 있다.
Stats
반응기 부피 V = 20
반응 상수 k = 300 1/h
활성화 에너지 N = 5
공급 온도 Tf = 0.3947
열전달 계수 αc = 1.95 × 10^-4
냉각수 온도 Tc = 0.3816