Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
연합 강화 학습에서의 유한 시간 분석
유한 시간 분석을 통한 온-정책 이질적 연합 강화 학습
연합 강화 학습 알고리즘 FedSARSA를 제안하고, 이에 대한 유한 시간 오차 분석을 수행하여 에이전트 간 협업을 통한 선형 가속 효과를 입증하였다.
1