Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
リニア関数近似を用いた方策評価
高確率下でのリニア関数近似を用いた方策評価のサンプル複雑性
リニア関数近似を用いた方策評価アルゴリズムであるTD学習とTDC学習について、高確率下での収束保証と問題パラメータに依存した厳密なサンプル複雑性を示した。
1