이 논문은 데이터 기반 모델 예측 제어(MPC) 시스템을 자동으로 튜닝하는 AutoMPC 시스템을 개선하는 방법을 제안한다. AutoMPC는 베이지안 최적화(BO)를 사용하여 MPC 설계 요소를 최적화하지만, 새로운 문제에 대해 매번 무작위로 초기화되어 비효율적이고 불안정할 수 있다.
이를 해결하기 위해 저자들은 메타 학습 기반의 Portfolio 기법을 도입한다. Portfolio는 이전 작업에서 얻은 다양한 구성을 활용하여 BO의 초기 설계를 최적화함으로써 튜닝 프로세스의 효율성과 안정성을 높인다.
실험 결과, Portfolio는 11개의 비선형 제어 시뮬레이션 벤치마크와 1개의 물리적 수중 소프트 로봇 데이터셋에서 순수 BO보다 우수한 성능을 보였다. Portfolio는 제한된 계산 자원 내에서 바람직한 솔루션을 찾는 데 도움이 되었다. 또한 Portfolio를 통해 얻은 우수한 모델은 최적의 MPC 제어기 합성에도 기여했다.
To Another Language
from source content
arxiv.org
Djupare frågor