Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
강건 마르코프 의사결정 과정에서의 오프-정책 평가
강력하고 효율적인 강건 마르코프 의사결정 과정에서의 오프-정책 평가
강건 마르코프 의사결정 과정에서 관찰된 전이 데이터를 활용하여 주어진 평가 정책의 최선/최악의 가치를 효율적이고 강건하게 추정하는 방법을 제안한다.
1