Khái niệm cốt lõi
MAexp는 다양한 MARL 알고리즘과 대표적인 탐색 시나리오를 통합하는 일반적이고 효율적인 플랫폼이다. 이를 통해 다양한 알고리즘의 성능을 엄격하게 평가하고 비교할 수 있는 기반을 마련한다.
Tóm tắt
MAexp는 다중 에이전트 탐색을 위한 일반적이고 효율적인 플랫폼이다. 이 플랫폼은 다양한 최신 MARL 알고리즘과 대표적인 탐색 시나리오를 통합한다.
플랫폼의 주요 특징은 다음과 같다:
점군 표현을 사용하여 실제 환경과 유사한 고충실도 맵을 구현하고, GPU 병렬 처리를 통해 빠른 샘플링 속도를 달성한다.
임의의 팀 크기와 로봇 유형을 처리할 수 있는 에이전트 프레임워크를 제공한다.
6개의 최신 MARL 알고리즘과 6개의 대표적인 시나리오를 통해 최초의 종합적인 벤치마크를 구축한다.
실험 결과를 통해 각 MARL 알고리즘의 고유한 강점이 다양한 시나리오에서 드러남을 확인할 수 있다. MAexp는 RL 기반 다중 에이전트 탐색 분야의 발전을 촉진할 것으로 기대된다.
Thống kê
랜덤 장애물 시나리오에서 ITRPO의 탐색 비율은 68.81% ± 5.71%이다.
미로 시나리오에서 IPPO의 85% 탐색 완료 단계는 377 ± 51 단계이다.
실내 중형 시나리오에서 MAPPO의 85% 상호 중첩은 38.22% ± 2.81%이다.
실외 시나리오에서 MAPPO의 탐색 비율은 70.19% ± 4.94%이다.
Trích dẫn
"MAexp는 다양한 MARL 알고리즘과 대표적인 탐색 시나리오를 통합하는 일반적이고 효율적인 플랫폼이다."
"MAexp는 다양한 알고리즘의 성능을 엄격하게 평가하고 비교할 수 있는 기반을 마련한다."
"MAexp는 RL 기반 다중 에이전트 탐색 분야의 발전을 촉진할 것으로 기대된다."