核心概念
本稿では、長期的な時間情報を状態表現に組み込むことで、特にノイズの多い環境や報酬のスパースな環境において、強化学習におけるエージェントの一般化能力を向上させる新しい状態表現学習手法、State Chrono Representation (SCR) を提案する。
要約
強化学習における一般化能力向上のための状態クロノ表現
Jianda Chen, Wen Zheng Terence Ng, Zichen Chen, Sinno Jialin Pan, Tianwei Zhang. State Chrono Representation for Enhancing Generalization in Reinforcement Learning. arXiv preprint arXiv:2411.06174v1, 2024.
高次元観測を用いた深層強化学習において、ノイズや報酬のスパース性に頑健で、一般化能力の高い状態表現を学習すること。