Centrala begrepp
입력 볼록 신경망(ICNN)을 활용하여 모델 예측 제어(MPC) 문제에서 전역 최적 해를 달성하고, 기존 ICNN 아키텍처의 폭발적인 기울기 문제를 해결하며, 신경망 기반 MPC의 수렴 속도를 개선하는 새로운 입력 볼록 LSTM(ICLSTM) 모델을 제안한다.
Sammanfattning
이 연구에서는 입력 볼록 신경망(ICNN)의 원리를 활용하여 새로운 입력 볼록 LSTM(ICLSTM) 모델을 제안했다. ICLSTM은 기존 ICNN 아키텍처의 폭발적인 기울기 문제를 완화하고, 신경망 기반 MPC의 수렴 속도를 개선하는 것을 목표로 한다.
ICLSTM의 주요 특징은 다음과 같다:
- 입력에 대해 볼록한 출력을 보장하기 위해 가중치와 활성화 함수에 대한 제약 조건을 적용했다.
- LSTM 레이어와 파라미터 없는 스킵 연결을 결합하여 폭발적인 기울기 문제를 해결하고 일반화 성능을 향상시켰다.
- LSTM 레이어 출력과 입력을 연결하는 밀집 레이어를 추가하여 차원을 일치시켰다.
이러한 ICLSTM 모델을 MPC 문제에 적용하여 실험한 결과, 기존 RNN, LSTM, ICRNN 모델 대비 각각 46.7%, 31.3%, 20.2%의 수렴 시간 단축 효과를 확인했다. 또한 ICRNN에서 관찰되던 폭발적인 기울기 문제가 ICLSTM에서는 해결되었음을 확인했다.
Statistik
제안한 ICLSTM 모델은 기존 RNN, LSTM, ICRNN 모델 대비 각각 46.7%, 31.3%, 20.2%의 수렴 시간 단축 효과를 보였다.
ICRNN 모델에서 관찰되던 폭발적인 기울기 문제가 ICLSTM 모델에서는 해결되었다.
Citat
"ICNN 기반 MPC는 전역 최적 해를 달성하는 데 성공했지만, 현재 ICNN 아키텍처에서는 폭발적인 기울기 문제가 발생하여 복잡한 작업에 대한 깊은 신경망으로 활용하는 데 한계가 있다."
"신경망 기반 MPC, 특히 ICNN 기반 MPC는 첫 원리 모델 기반 MPC에 비해 수렴 속도가 느리다는 문제가 있다."