다중 에이전트 강화 학습을 사용하여 반복 조합 경매 디자인을 이해하는 방법
다중 에이전트 환경에서 에이전트 간의 상호 작용이 제한적인 경우, BUN (Bottom Up Network)이라는 새로운 희소 신경망 훈련 방식을 통해 효율적인 학습 및 성능 향상을 달성할 수 있다.
다중 에이전트 강화 학습 (MARL)에서 등변 그래프 신경망 (EGNN)을 활용하여 샘플 효율성과 일반화 능력을 향상시킬 수 있지만, 초기 탐색 시 발생하는 편향 문제를 해결해야 하며, 이를 위해 탐색 강화 등변 그래프 신경망 (E2GN2)을 제안합니다.
본 논문에서는 생성적 세계 모델을 활용하여 복잡한 다중 에이전트 의사 결정 문제에 대한 보다 현실적이고 정확한 답변을 생성하는 방법론인 LBI(Learning before Interaction)을 제안합니다.