Centrala begrepp
本文探討如何利用指數準則設計出對環境和模型擾動具有魯棒性的強化學習策略。
Noorani, E., Mavridis, C. N., & Baras, J. S. (2024). Risk-Sensitive Reinforcement Learning with Exponential Criteria. arXiv preprint arXiv:2212.09010v5.
本研究旨在解決強化學習中常見的對噪聲和模型參數擾動敏感的問題,並提出基於指數準則的風險敏感型強化學習方法來提高策略的魯棒性。