핵심 개념
비볼록 게임에서는 내쉬 균형이 존재하지 않거나 계산하기 어려울 수 있다. 이를 해결하기 위해 (ε, Φ(δ))-국소 균형이라는 새로운 균형 개념을 제안하였다. 이 균형 개념은 게임 이론적으로 의미 있고 보편적이며 계산 가능하다. 또한 온라인 경사 하강법과 같은 간단한 분산 학습 동역학이 이 균형에 효율적으로 수렴한다는 것을 보였다.
초록
이 논문은 비볼록 게임에서 의미 있고 계산 가능한 균형 개념을 제안한다. 주요 내용은 다음과 같다:
(ε, Φ(δ))-국소 균형 개념 제안: 이는 각 플레이어가 δ 이내의 국소 전략 변경을 통해 자신의 기대 효용을 ε 이상 증가시킬 수 없는 분포를 의미한다. 이는 국소 내쉬 균형을 일반화한 개념이다.
(ε, ΦInt(δ))-국소 균형과 (ε, ΦProj(δ))-국소 균형 두 가지 구체적인 균형 개념 제시:
ΦInt(δ)는 입력 전략과 상수 전략 보간을 통한 국소 변경을 포함한다.
ΦProj(δ)는 고정 방향으로의 작은 이동 후 투영을 통한 국소 변경을 포함한다.
온라인 경사 하강법(GD)과 낙관적 경사 하강법(OG)이 각각 ΦInt(δ)-regret와 ΦProj(δ)-regret를 효율적으로 최소화하여, 이를 통해 (ε, ΦInt(δ))-국소 균형과 (ε, ΦProj(δ))-국소 균형에 효율적으로 수렴함을 보였다.
국소 영역에서는 (ε, Φ(δ))-국소 균형을 효율적으로 계산할 수 있지만, 전역 영역에서는 이를 계산하는 것이 NP-hard임을 보였다.
통계
각 플레이어의 전략 공간 Xi의 직경은 D 이하이다.
각 플레이어의 효용 함수 ui는 G-Lipschitz하고 L-smooth하다.
인용구
"Von Neumann의 유명한 minimax 정리는 플레이어의 효용 함수가 자신의 전략에 대해 연속적이고 볼록한 경우 내쉬 균형의 존재를 보장한다."
"비볼록 게임에서는 내쉬 균형이 존재하지 않을 수 있고, 혼합 내쉬, 상관 및 거친 상관 균형이 무한한 지지를 가지며 계산하기 어렵다."