Download Linnk AI
•
AI-onderzoeksassistent
>
Inloggen
inzicht
-
リニア関数近似を用いた方策評価
高確率下でのリニア関数近似を用いた方策評価のサンプル複雑性
リニア関数近似を用いた方策評価アルゴリズムであるTD学習とTDC学習について、高確率下での収束保証と問題パラメータに依存した厳密なサンプル複雑性を示した。
1