이 논문에서는 다중 에이전트 강화 학습 문제를 해결하기 위해 보상 기계(Reward Machine, RM)를 활용하는 MAHRM(Multi-Agent Reinforcement Learning with a Hierarchy of Reward Machines) 프레임워크를 제안한다.
MAHRM은 다음과 같은 특징을 가진다:
실험 결과, MAHRM은 동일한 고수준 이벤트 정보를 활용하는 다른 MARL 방법들에 비해 우수한 성능을 보였다. 특히 에이전트들이 높은 상호 의존성을 가지는 복잡한 시나리오에서 MAHRM의 장점이 두드러졌다.
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Xuejing Zhen... : arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07005.pdfDaha Derin Sorular