Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
강건 마르코프 의사결정 과정에서의 오프-정책 평가
강력하고 효율적인 강건 마르코프 의사결정 과정에서의 오프-정책 평가
강건 마르코프 의사결정 과정에서 관찰된 전이 데이터를 활용하여 주어진 평가 정책의 최선/최악의 가치를 효율적이고 강건하게 추정하는 방법을 제안한다.
1