核心概念
マルチタスク強化学習における多様なタスクセットは、ϵ-greedyのような短視点探索デザインをサンプル効率的にすることができる。
要約
この論文は、マルチタスク強化学習における多様なタスクセットの重要性を示し、ϵ-greedy探索戦略が実践上成功する理由を明らかにしています。実験結果は、適切な高さの障害物がある環境で特徴共分散行列の分布に大きな影響を与えることを示しています。また、自動カリキュラム学習アルゴリズムが選択したタスクセットと同様の傾向が見られました。
統計
λmin(Φ˜πh+1) ≥ ϵhQh−1h′=1(1 − ϵh′)b2/(2dA)
α(f, F, M) = Ω(β^2b^2/(|A||M|H)) by setting ϵh = 1/(h+1)