Alapfogalmak
본 논문에서는 비정상 환경에서 에이전트가 새로운 작업에 빠르게 적응하고 효과적으로 학습할 수 있도록 잠재적 상상을 통해 행동을 학습하는 적응형 세계 모델인 HiP-POMDP Formalism을 제안합니다.
Kivonat
HiP-POMDP: 잠재적 상상 기반 적응형 세계 모델 연구 논문 요약
Emiliyan Gospodinov, Vaisakh Shaj, Philipp Becker, Stefan Geyer, Gerhard Neumann. (2024). Adaptive World Models: Learning Behaviors by Latent Imagination Under Non-Stationarity. Advances in Neural Information Processing Systems, 38.
본 연구는 비정상 환경에서 잠재적 상상을 통해 행동을 학습하는 적응형 세계 모델을 개발하는 것을 목표로 합니다. 특히, 변화하는 환경에서 에이전트가 새로운 작업에 효과적으로 적응하고 학습할 수 있도록 하는 데 중점을 둡니다.