본 논문에서는 상태별 제약 조건이 있는 안전 다중 에이전트 강화 학습 (MARL)을 위한 새로운 이론적 프레임워크를 제안하며, 이는 제어 불변 집합 (CIS)을 활용하여 안전성과 성능 사이의 최적 균형을 달성하고 일반화된 내쉬 균형으로의 수렴을 보장합니다.