Schnelle nichtlineare zweizeitige stochastische Approximation: Erreichung einer endlichen Stichprobenkomplexität von O(1/k)
Die Arbeit schlägt eine neue Variante der zweizeitigen stochastischen Approximation vor, die die klassische Ruppert-Polyak-Mittelungstechnik nutzt, um die Operatoren aus ihren Stichproben zu schätzen. Die mittleren quadratischen Fehler der erzeugten Iterationen konvergieren mit einer optimalen Rate von O(1/k) gegen Null, was eine deutliche Verbesserung gegenüber der besten bekannten Rate von O(1/k2/3) darstellt.