下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
線性分佈式健壯式強化學習
線性分佈式健壯式離線強化學習的上下界
我們提出了一種新的算法We-DRIVE-U,它在平均次最優性方面的表現優於現有算法,並且在計算效率方面也有顯著改善。我們還證明了這個算法在任意不確定性水平下都是近乎最優的。
1