הורד את Linnk AI
•
עוזר מחקר
>
התחברות
תובנה
-
다중 에이전트 강화 학습 정책 평가
다중 에이전트 강화 학습 정책 평가를 위한 새로운 접근법: 국소 TD 업데이트를 통한 효율적인 샘플 및 통신
다중 에이전트 강화 학습 정책 평가 문제에서 국소 TD 업데이트 접근법은 기존 합의 기반 접근법에 비해 샘플 및 통신 복잡도를 크게 낮출 수 있다.
1