Завантажити Linnk AI
•
Помічник з досліджень
>
Увійти
ідея
-
离线策略评估
深度抽象状态空间下的离线策略评估
本文提出了一种基于深度抽象状态空间的离线策略评估方法,通过迭代地压缩状态空间维度,大幅降低了离线策略评估的样本复杂度。
1