ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
Greedy-GQアルゴリズムの有限時間解析
線形関数近似を用いたGreedy-GQアルゴリズムの有限時間誤差界
Greedy-GQアルゴリズムは、線形関数近似を用いた最適制御問題に対して、i.i.d.環境下では√T の収束速度、マルコフ環境下ではlog T/√T の収束速度を持つ。
1