Linnk AI herunterladen
•
Forschungsassistent
>
Anmelden
Einblick
-
リニア関数近似を用いた方策評価
高確率下でのリニア関数近似を用いた方策評価のサンプル複雑性
リニア関数近似を用いた方策評価アルゴリズムであるTD学習とTDC学習について、高確率下での収束保証と問題パラメータに依存した厳密なサンプル複雑性を示した。
1