Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
离线策略评估
深度抽象状态空间下的离线策略评估
本文提出了一种基于深度抽象状态空间的离线策略评估方法,通过迭代地压缩状态空间维度,大幅降低了离线策略评估的样本复杂度。
1