Linnk AI'yı İndirin
•
Araştırma Asistanı
>
Giriş Yap
içgörü
-
离线策略评估
深度抽象状态空间下的离线策略评估
本文提出了一种基于深度抽象状态空间的离线策略评估方法,通过迭代地压缩状态空间维度,大幅降低了离线策略评估的样本复杂度。
1