Kernekoncepter
적대적 환경에서 신원을 숨기는 게임에서 균형 정책이 존재하고, 적대적 플레이어가 상대방의 정책을 학습하는 방법을 제안합니다.
Statistik
"모든 행동은 허용됩니다." - Assumption 5
"플레이어 1이 승리할 수 있는 상태 집합을 식별합니다." - Lemma 6
"플레이어 1의 정책이 무한 점유 측정을 가질 때 목적 함수는 무한합니다." - Lemma 6
"플레이어 1의 정책이 무한 점유 측정을 가질 때 목적 함수는 무한합니다." - Lemma 7
Citater
"플레이어 1은 평균 플레이어의 승리와 구별되지 않는 승리를 달성하기 위해 노력합니다."
"플레이어 2는 적대적 플레이어의 신원을 최소화하기 위해 정책을 설계합니다."