本研究では、強化学習を用いて単一の修正ポリシーを学習し、それを適用してゲームを修正することで、既存のNash均衡近似手法の性能を向上させる手法REINFORCEMENTNASHEQUILIBRIUMSOLVERを提案した。具体的な貢献は以下の3点:
大規模な通常形ゲームを用いた実験の結果、提案手法REINFORCEMENTNASHEQUILIBRIUMSOLVERは、α-rank、CE、FP、PRDなどの既存の近似手法の性能を向上させることができ、さらに未知のゲームにも適用可能であることが示された。
To Another Language
from source content
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Xinrun Wang,... ที่ arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03518.pdfสอบถามเพิ่มเติม