Core Concepts
불확실성이 있는 다중 플레이어 집계 게임에서 블랙박스 집계기의 가중치를 역학습하고, 이를 활용하여 최악의 경우에도 강건한 내쉬 균형을 구하는 방법을 제안한다.
Abstract
이 논문은 불확실성이 있는 다중 플레이어 집계 게임에서 강건한 내쉬 균형을 구하는 방법을 제안한다.
게임 모델 정의:
N명의 플레이어가 참여하는 집계 게임
각 플레이어의 전략은 xi이며, 집계기 σ(x)는 플레이어들의 가중치 합으로 정의됨
불확실성은 결합 제약 조건 Ωα에 존재하며, 이는 다양한 α 값에 대해 만족되어야 함
역학습 방법 제안:
플레이어들의 가중치 β가 알려지지 않은 블랙박스 집계기 상황을 고려
주어진 데이터 (α, x*α)를 활용하여 역변분부등식 관계를 통해 β를 추정하는 방법 제안
강건성 분석:
추정된 β를 활용하여 최악의 경우에도 강건한 내쉬 균형 x*을 구하는 방법 제시
강건 내쉬 균형의 1차 필요 조건을 도출
일반화 보장:
제안한 역학습 방법의 일반화 성능을 위반 확률 개념을 통해 분석
데이터 크기에 따른 일반화 보장 상한을 제공
수치 실험:
전기 수요 관리 문제에 적용하여 제안 방법의 유효성 검증
데이터 크기에 따른 학습 성능과 일반화 보장 상한 제시
Stats
각 플레이어의 전략 xi는 결합 제약 조건 Ωα 내에 존재해야 한다.
결합 제약 조건은
PN
i=1 αT
i xi ≤ b 형태로 주어진다.
Quotes
"주어진 α에 대해 x*α는 Gα의 vGNE이다."
"x*는 게임 G의 rGNE이다."