다중 에이전트 시스템에서 개인적 이득과 집단 보상 간의 균형을 달성하기 위한 전략을 탐구하고, 평균장 게임 이론을 활용하여 무한대 규모의 에이전트 집단에서의 균형 해법과 보상 구조를 제시한다.
본 논문에서는 강한 단조성을 가지는 게임에 대한 예측 제어 기반 피드백 제어기의 안정성 증명 기법을 제시한다. 이를 통해 다중 에이전트 시스템의 경쟁적 자원 할당 문제에 대한 안정적인 해법을 제공한다.
가격 차별화 게임에서 구매자의 효용 극대화 전략으로 인해 자연스럽게 프라이버시가 발생한다. 판매자가 구매자의 신호를 무시할 수 있도록 약속하면 구매자의 전략적 행동이 필요 없어져 판매자 주도의 프라이버시가 발생한다.
정찰병을 활용하여 상대방의 자원 배분을 사전에 파악할 수 있는 일반 로또 게임에서, 정보와 힘의 균형을 최적화하는 전략을 제시한다.
동적 게임의 완전 균형을 근사하기 위한 충분 필요 조건을 발견하였고, 이를 통해 비특이 완전 균형에 대한 완전 다항식 시간 근사 방식을 구축하였다.
행동 편향을 가진 상대방을 상대로 사전 지식이나 보상 관찰 없이도 거의 모든 라운드에서 승리할 수 있다.
정보 불완전 게임에서 무작위 전략을 합성하는 것은 일반적인 게임에서와 같지 않다. 정규 게임에서는 무작위 전략의 합성이 가능하지만, 더 일반적인 모델에서는 그렇지 않다.
매끄러운 게임에서 국소 상관 균형은 연속 벡터 필드를 따라 전략을 변경할 때 어떤 후회도 없는 행동 분포이다. 이러한 균형은 게임의 projected gradient 동역학과 밀접하게 연관되어 있다. 우리는 미분 가능 함수의 gradient 필드에 대해 후회가 없는 균형의 동등한 개념을 식별한다. 그 결과, 이러한 균형은 모든 플레이어가 동일한 학습률로 온라인 (projected) gradient 상승을 사용할 때 근사화될 수 있으며, 그들의 compact 및 convex 행동 집합이 (1) 매끄러운 경계를 가지거나 (2) 선형 최적화가 "trivial"한 다면체인 경우에 성립한다.
두 명의 플레이어가 남은 상황에서 한 플레이어가 항상 승리할 수 있는 전략을 제시한다.
개인의 이익과 집단의 이익을 충분히 정렬시킴으로써 합리적인 행위자들이 집단의 이익을 극대화하도록 만드는 것이 핵심 아이디어이다.