Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
Greedy-GQアルゴリズムの有限時間解析
線形関数近似を用いたGreedy-GQアルゴリズムの有限時間誤差界
Greedy-GQアルゴリズムは、線形関数近似を用いた最適制御問題に対して、i.i.d.環境下では√T の収束速度、マルコフ環境下ではlog T/√T の収束速度を持つ。
1