ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
リニア関数近似を用いた方策評価
高確率下でのリニア関数近似を用いた方策評価のサンプル複雑性
リニア関数近似を用いた方策評価アルゴリズムであるTD学習とTDC学習について、高確率下での収束保証と問題パラメータに依存した厳密なサンプル複雑性を示した。
1