核心概念
滑らかなゲームにおいて、プレイヤーが任意の連続ベクトル場に沿って戦略を変更しても後悔しない分布を特定する。このような均衡は勾配動力学と密接に関連しており、微分可能な関数の勾配場に対して後悔しない場合の「粗い」均衡概念を同定する。このような均衡は、すべてのプレイヤーが等しい学習率でオンライン勾配上昇法を用いる場合に近似可能である。
要約
本論文では、滑らかなゲームにおける局所的な相関均衡の概念を提案している。従来の相関均衡は、プレイヤーの戦略空間が凸集合であることを前提としていたが、本研究では非凸ゲームにも適用可能な局所的な相関均衡を定義している。
具体的には以下の2つの均衡概念を提案している:
-
局所的相関均衡: プレイヤーが任意の連続ベクトル場に沿って戦略を変更しても後悔しない分布。
-
定常的相関均衡: プレイヤーの期待payoffが勾配動力学の固定点となる分布。
これらの均衡概念は、勾配動力学の性質と密接に関連しており、オンライン勾配上昇法によって近似可能であることを示している。具体的には以下の結果を得ている:
- 各プレイヤーの行動空間が滑らかな境界を持つ凸集合の場合や、ポリトープの場合、オンライン勾配上昇法によって効率的に近似可能。
- 定常的相関均衡に対する双対的な性質を持つ一般化Lyapunovファンクションを構成できる。これにより、勾配動力学の下での期待payoffの上界を導出できる。
- 有限個の連続ベクトル場に対する局所的/定常的相関均衡も近似可能であり、その計算は凸二次最適化問題に帰着される。
以上のように、本研究は非凸ゲームにおける新たな均衡概念を提案し、その近似計算手法を明らかにしている。
統計
各プレイヤーiの効用関数uiの勾配の大きさの上界Gi
各プレイヤーiの効用関数uiの勾配のリプシッツ定数Li
行動空間Xの直径d(X)
行動空間Xiの境界の最大曲率K