다양한 대칭성을 활용하여 에이전트 간 제로샷 협력을 향상시킬 수 있는 등변환 신경망 모델을 제안한다.
본 연구는 다양한 에이전트 간 협력을 위해 확장 가능한 이종 다중 에이전트 강화학습 프레임워크를 제안한다. 이를 통해 에이전트 수가 변화하는 상황에서도 유연한 역할 분담과 협력이 가능하다.
다양한 적대적 환경 시나리오를 생성하여 사전 학습된 다중 에이전트 정책의 전략적 취약점을 드러내는 접근법