Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
다중 에이전트 강화 학습을 위한 개인화된 훈련 및 증류된 실행
개인화된 훈련과 증류된 실행을 통한 다중 에이전트 강화 학습
개인화된 글로벌 정보를 활용하여 각 에이전트의 개별 Q-함수 또는 개별 정책을 향상시키고, 이를 지식 증류를 통해 분산 실행에 적용할 수 있는 새로운 PTDE 패러다임을 제안한다.
1