Основні поняття
本稿では、オフライン強化学習における従来軽視されてきた分布外状態問題に着目し、分布外状態への補正と分布外行動の抑制を統合したシンプルかつ効果的な新手法SCASを提案する。
Анотація
オフライン強化学習における分布外状態問題への取り組み:SCAS
Mao, Y., Wang, C., Chen, C., Qu, Y., & Ji, X. (2024). Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression. Advances in Neural Information Processing Systems, 38.
本研究は、オフライン強化学習における分布外(OOD)状態問題に対処するため、OOD状態への補正とOOD行動の抑制を統合した新しい手法であるSCASを提案することを目的とする。