Linnk AI herunterladen
•
Forschungsassistent
>
Anmelden
Einblick
-
离线策略评估
深度抽象状态空间下的离线策略评估
本文提出了一种基于深度抽象状态空间的离线策略评估方法,通过迭代地压缩状态空间维度,大幅降低了离线策略评估的样本复杂度。
1