본 연구에서는 다중 에이전트 시스템의 행동 이질성을 측정하기 위한 새로운 지표인 System Neural Diversity (SND)를 소개한다. SND는 에이전트 간 행동 거리를 Wasserstein 거리로 정의하고, 이를 시스템 수준에서 집계하여 다양성을 나타낸다. SND는 기존 지표인 Hierarchic Social Entropy (HSE)와 달리 에이전트 수에 따라 다양성이 변하지 않으며, 행동 중복도를 측정할 수 있는 특성을 가진다.
다양한 협력 다중 로봇 과제에 대한 실험을 통해 SND가 기존에 관찰할 수 없었던 성능 및 회복력 특성을 측정할 수 있음을 보였다. 특히 과제 수행 중 반복적인 방해가 발생하는 동적 과제에서, SND를 통해 에이전트들이 방해에 대처하기 위해 습득한 잠재적 다양성 기술을 측정할 수 있었다. 또한 SND를 활용하여 원하는 다양성 수준을 유지하며 학습을 진행할 수 있음을 보였다. 이는 기존 방식보다 효율적인 다중 에이전트 강화 학습 패러다임을 가능하게 한다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Matteo Betti... um arxiv.org 09-11-2024
https://arxiv.org/pdf/2305.02128.pdfTiefere Fragen