Effiziente Nutzung von Vision-Sprache-Modellen als Belohnungsfunktionen für Reinforcement Learning
Vision-Sprache-Modelle können als leistungsfähige, nullschuss-basierte Belohnungsmodelle für Reinforcement Learning verwendet werden, um komplexe Aufgaben ohne manuell spezifizierte Belohnungsfunktionen zu lernen.