本文研究了多矩陣博弈中找到納什均衡的計算複雜性。特別是,作者研究了兩隊多矩陣零和博弈的情況,其中每對玩家要麼玩零和博弈,要麼玩協調博弈。
作者首先證明,即使在最簡單的情況下,即當一隊由多個獨立對手組成時,找到近似納什均衡仍然是CLS難的。這表明即使在這種簡單的設定中,也不太可能存在高效的算法來找到納什均衡。
作者進一步證明,當一隊由多個獨立對手組成時,問題實際上是CLS完全的,這意味著這個下限是最優的。
這些結果不僅適用於多矩陣博弈,也適用於一類簡單的非凸-非凹約束最小最大優化問題。這些結果為理解多智能體強化學習中的收斂保證提供了重要的理論基礎。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询