이 논문에서는 다중 에이전트 강화 학습 문제를 해결하기 위해 보상 기계(Reward Machine, RM)를 활용하는 MAHRM(Multi-Agent Reinforcement Learning with a Hierarchy of Reward Machines) 프레임워크를 제안한다.
MAHRM은 다음과 같은 특징을 가진다:
실험 결과, MAHRM은 동일한 고수준 이벤트 정보를 활용하는 다른 MARL 방법들에 비해 우수한 성능을 보였다. 특히 에이전트들이 높은 상호 의존성을 가지는 복잡한 시나리오에서 MAHRM의 장점이 두드러졌다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Xuejing Zhen... a las arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07005.pdfConsultas más profundas