Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
인간 지원 다중 에이전트 재그룹화
다중 에이전트 강화 학습을 위한 퍼뮤테이션 불변 평가기를 활용한 인간 지원 재그룹화
HARP는 훈련 중 자동 에이전트 재그룹화와 배치 중 전략적 인간 지원을 통해 복잡한 다중 에이전트 과제에서 성능을 향상시킨다.
1