핵심 개념
매끄러운 게임에서 국소 상관 균형은 연속 벡터 필드를 따라 전략을 변경할 때 어떤 후회도 없는 행동 분포이다. 이러한 균형은 게임의 projected gradient 동역학과 밀접하게 연관되어 있다. 우리는 미분 가능 함수의 gradient 필드에 대해 후회가 없는 균형의 동등한 개념을 식별한다. 그 결과, 이러한 균형은 모든 플레이어가 동일한 학습률로 온라인 (projected) gradient 상승을 사용할 때 근사화될 수 있으며, 그들의 compact 및 convex 행동 집합이 (1) 매끄러운 경계를 가지거나 (2) 선형 최적화가 "trivial"한 다면체인 경우에 성립한다.
초록
이 논문은 매끄러운 게임에서의 국소 상관 균형에 대해 다룬다. 저자들은 두 가지 개념을 제안한다:
- 국소 상관 균형: 플레이어들은 연속 벡터 필드를 따라 전략을 변경할 때 어떤 후회도 없다.
- 정상 상관 균형: 균형은 게임의 gradient 동역학의 고정점 성질을 만족한다.
저자들은 이러한 균형이 근사화될 수 있는 설정을 확인한다:
- 각 플레이어의 행동 집합이 매끄러운 경계와 제한된 곡률을 가지는 경우
- 각 플레이어의 행동 집합이 "급한" 다면체인 경우 (단순 심플렉스와 초입방체 포함)
이 경우 온라인 projected gradient 상승 알고리즘이 근사 균형을 산출한다.
또한 저자들은 정상 상관 균형에 대한 dual 하한 증명이 게임의 gradient 동역학에 대한 일반화된 Lyapunov 함수 형태를 취한다는 것을 보인다. 이는 가격 무질서 문헌에서의 primal-dual 성능 보장 형태를 일반화한다.
마지막으로 저자들은 유한한 벡터 필드 집합에 대해 일반 국소 상관 균형이 근사화될 수 있음을 보인다. 이때 선형 또는 원뿔 결합에 대한 고정점 오라클에 접근할 수 있어야 한다. 특히 affine-linear 벡터 필드의 경우, 이러한 고정점은 convex 2차 최소화 문제의 해결로 귀결된다.
통계
각 플레이어 i의 gradient 크기 상한 Gi
각 플레이어 i의 gradient Lipschitz 계수 Li
행동 집합 X의 직경 d(X)
경계 곡률 상한 K