Scarica Linnk AI
•
Assistente di Ricerca
>
Accedi
approfondimento
-
다중 에이전트 MDP에서의 확률적 에이전트 탈락 문제
다중 에이전트 MDP에서 확률적 에이전트 탈락 하에서의 모델 프리 학습 및 최적 정책 설계
확률적 에이전트 탈락이 발생하는 다중 에이전트 MDP에서, 탈락 전 시스템에서 수집한 샘플을 활용하여 탈락 후 시스템의 최적 정책을 찾는 방법을 제안한다.
1