Temel Kavramlar
オフライン強化学習における一般化の適切な活用方法として、行動の一般化と一般化の伝播の両方を緩やかに制御する「二重に緩やかな一般化(DMG)」という新しい概念を提案する。
Özet
オフライン強化学習における二重に緩やかな一般化に関する研究論文の概要
Mao, Y., Wang, Q., Qu, Y., Jiang, Y., & Ji, X. (2024). Doubly Mild Generalization for Offline Reinforcement Learning. Advances in Neural Information Processing Systems, 38. arXiv:2411.07934v1 [cs.LG].
本研究は、オフライン強化学習(RL)における、データセット外の行動に対する価値関数や方策の過剰な一般化に起因する外挿エラーと価値の過大評価の問題に対処することを目的とする。