Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
Finite-Time Analyse von TD-Lernen
Analyse der TD-Lernkonvergenz mit linearer Funktionsapproximation
Die Analyse zeigt, wie TD-Lernen mit linearer Funktionsapproximation in endlicher Zeit konvergiert.
1