Core Concepts
モンテカルロ探索を用いて、モンテカルロ木探索アルゴリズムのための新しい探索項を自動的に設計する。
Abstract
本論文では、モンテカルロ探索を用いて、モンテカルロ木探索アルゴリズムのための新しい探索項を自動的に設計する手法を提案する。
まず、モンテカルロ木探索アルゴリズムの概要を説明する。代表的なアルゴリズムであるPUCTとSHUSSについて詳しく述べる。特に、SHUSSアルゴリズムでは、探索項を用いて探索を行うことを示す。
次に、数学的な式を生成し、探索項として使用する手法を説明する。モンテカルロ探索を用いて、様々な数式を生成し、それらの探索項としての性能を評価する。AMAF(All Moves As First)プライオリティを用いることで、効率的に良い探索項を見つけられることを示す。
実験では、囲碁の問題に適用し、提案手法で発見した探索項がPUCTやSHUSSアルゴリズムと比べて優れた性能を示すことを確認する。特に、小さな探索予算の下で、提案手法の探索項がPUCTやSHUSSの標準的な探索項よりも優れた結果を得られることを示す。
本手法は、単純かつ効率的であり、問題に応じて最適な探索項を自動的に発見できる。今後は、探索項の発見をさらに高速化したり、他の問題にも適用するなど、AIによるAI改善の可能性を広げていくことが期待される。
Stats
探索予算が32回の評価の場合、発見した探索項はPUCTやSHUSSの標準的な探索項と比べて競争力のある性能を示した。
SHUSSアルゴリズムでは、発見した探索項 3×pr + max(3, sc)が、標準的な探索項scよりも優れた性能を示した。
SHUSSアルゴリズムでは、発見した探索項 sc × (pr + sc × sc)が、標準的な探索項scよりも優れた性能を示した。
Quotes
モンテカルロ探索を用いて、AIアルゴリズムを改善するという長年の目標の一部として、本研究を位置づけることができる。
提案手法は単純かつ効率的であり、問題に応じて最適な探索項を自動的に発見できる。