Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
Finite-Time Analyse von TD-Lernen
Analyse der TD-Lernkonvergenz mit linearer Funktionsapproximation
Die Analyse zeigt, wie TD-Lernen mit linearer Funktionsapproximation in endlicher Zeit konvergiert.
1