Скачать Linnk AI
•
Научный ассистент
>
Войти
аналитика
-
リニア関数近似を用いた方策評価
高確率下でのリニア関数近似を用いた方策評価のサンプル複雑性
リニア関数近似を用いた方策評価アルゴリズムであるTD学習とTDC学習について、高確率下での収束保証と問題パラメータに依存した厳密なサンプル複雑性を示した。
1