본 연구에서는 다중 에이전트 시스템의 행동 이질성을 측정하기 위한 새로운 지표인 System Neural Diversity (SND)를 소개한다. SND는 에이전트 간 행동 거리를 Wasserstein 거리로 정의하고, 이를 시스템 수준에서 집계하여 다양성을 나타낸다. SND는 기존 지표인 Hierarchic Social Entropy (HSE)와 달리 에이전트 수에 따라 다양성이 변하지 않으며, 행동 중복도를 측정할 수 있는 특성을 가진다.
다양한 협력 다중 로봇 과제에 대한 실험을 통해 SND가 기존에 관찰할 수 없었던 성능 및 회복력 특성을 측정할 수 있음을 보였다. 특히 과제 수행 중 반복적인 방해가 발생하는 동적 과제에서, SND를 통해 에이전트들이 방해에 대처하기 위해 습득한 잠재적 다양성 기술을 측정할 수 있었다. 또한 SND를 활용하여 원하는 다양성 수준을 유지하며 학습을 진행할 수 있음을 보였다. 이는 기존 방식보다 효율적인 다중 에이전트 강화 학습 패러다임을 가능하게 한다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Matteo Betti... lúc arxiv.org 09-11-2024
https://arxiv.org/pdf/2305.02128.pdfYêu cầu sâu hơn