Linnk AI herunterladen
•
Forschungsassistent
>
Anmelden
Einblick
-
Finite-Time Analyse von TD-Lernen
Analyse der TD-Lernkonvergenz mit linearer Funktionsapproximation
Die Analyse zeigt, wie TD-Lernen mit linearer Funktionsapproximation in endlicher Zeit konvergiert.
1