提案手法GCMR(Guided Cooperation via Model-based Rollout)は、階層的強化学習システムにおける層間の情報同期と協調を促進することで、学習効率を大幅に向上させる。
CRISPは、下位レベルの原始的な行動を進化させるための達成可能なサブゴールのカリキュラムを効果的に生成する新しい階層的強化学習アルゴリズムである。