Effiziente und ausdrucksstarke Konsistenzmodelle als Richtlinienklasse für Reinforcement Learning
Konsistenzmodelle bieten eine effiziente und ausdrucksstarke Darstellung von Richtlinien für Reinforcement Learning, die in verschiedenen Szenarien wie offline, offline-zu-online und online eingesetzt werden können und mit Verhaltensklonen und Akteur-Kritiker-Algorithmen kombiniert werden können.