팀워크는 합리적이고 자기 이익을 추구하는 에이전트들이 의무 없이 참여하는 상황에서도 가능하다. 다중 에이전트 다완팔 밴딧 시스템을 통해 이러한 팀워크 상황의 균형점을 학습할 수 있다.
Teamwork can be modeled as a non-cooperative game where self-interested agents make strategic decisions about their contributions, leading to emergent teamwork outcomes. A multiagent multi-armed bandit framework can be used to learn theoretically grounded predictions of team performance.
Architectural changes, rather than external pressures, are necessary for the emergence of temporal references in multiagent communication.
다중 에이전트 환경에서 에이전트의 행동이 다른 에이전트의 행동에 의해 영향을 받을 수 있는 상황에서, 에이전트에게 부여되는 네 가지 형태의 권한(보장 권한, 허용 권한, 약한 보장 권한, 약한 허용 권한)을 정의하고 이들의 상호작용을 분석한다.
The authors propose a decentralized guidance law for multiagent systems to safely enclose a stationary target while exhibiting self-organizing behavior, using only relative information between agents and the target.
The author argues that considering hints and normative messages in addition to sanctions leads to faster norm emergence and better cooperation in multiagent systems.