핵심 개념
ノーリグレット学習を用いて近似的に最適な相関均衡を達成するには、ゲームの規模に対してほぼ線形時間に相当する反復回数が必要となることが示された。
Anagnostides, I., Kalavasis, A., & Sandholm, T. (2024). Barriers to Welfare Maximization with No-Regret Learning. arXiv preprint arXiv:2411.01720v1.
本論文では、ノーリグレット学習を用いて、最適な社会福祉に近似する均衡(近似最適均衡)に到達するために必要な反復回数の計算量の下限を明らかにすることを目的とする。