核心概念
本稿では、大規模展開型ゲームにおいてサンプル効率の高いナッシュ均衡近似を実現する、リグレット最小化に基づく新しいダブルオラクルフレームワークを提案する。
要約
リグレット最小化ダブルオラクル:大規模展開型ゲームにおけるサンプル効率の高い解法
Tang, X., Wang, C., Ma, C., Bogunovic, I., McAleer, S., & Yang, Y. (2024). Sample-Efficient Regret-Minimizing Double Oracle in Extensive-Form Games. arXiv preprint arXiv:2411.00954v1.
本研究は、大規模展開型ゲームにおいてサンプル効率の高いナッシュ均衡近似を実現する、リグレット最小化に基づく新しいダブルオラクルフレームワークを提案することを目的とする。