Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
离线策略评估
深度抽象状态空间下的离线策略评估
本文提出了一种基于深度抽象状态空间的离线策略评估方法,通过迭代地压缩状态空间维度,大幅降低了离线策略评估的样本复杂度。
1