Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
線性分佈式健壯式強化學習
線性分佈式健壯式離線強化學習的上下界
我們提出了一種新的算法We-DRIVE-U,它在平均次最優性方面的表現優於現有算法,並且在計算效率方面也有顯著改善。我們還證明了這個算法在任意不確定性水平下都是近乎最優的。
1