Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
Greedy-GQアルゴリズムの有限時間解析
線形関数近似を用いたGreedy-GQアルゴリズムの有限時間誤差界
Greedy-GQアルゴリズムは、線形関数近似を用いた最適制御問題に対して、i.i.d.環境下では√T の収束速度、マルコフ環境下ではlog T/√T の収束速度を持つ。
1