Core Concepts
リアルな経験が限られている場合でも、夢想に基づくトレーニングはRLエージェントの汎化能力を向上させることが示された。
Abstract
強化学習における一般化能力向上の重要性とその方法論に焦点を当てた研究。
リアルな経験が限られている場合、夢想に基づくトレーニングはRLエージェントの汎化能力を高めることが示された。
4つのProcGen環境で実験を行い、提案手法が従来の方法よりも優れた汎化性能を達成した。
変換技術(ランダムスイング、DeepDream、価値多様性)ごとに異なる効果が観察され、混合手法では大きな改善は見られなかった。
Stats
本研究では、リアルな経験が限られている場合でもRLエージェントの汎化能力向上を示す重要なメトリクスや数字はありません。
Quotes
"The Overfitted Brain hypothesis (Hoel, 2021) suggests dreams happen to allow generalization in the human brain."
"Experiments on four ProcGen environments show that, compared to classic imagination and offline training on collected experience, our method can reach a higher level of generalization when dealing with sparsely rewarded environments."