本論文では、モンテカルロ批判家の ensemble を用いた探索ガイダンスモジュールを提案し、これを組み込んだ新しい強化学習アルゴリズムMOCCOを紹介する。提案手法は、従来の無作為探索手法に比べて優れた性能を示す。