Effiziente Datengenerierung durch menschengeleitete Datenaugmentierung für Offline-Verstärkungslernen und Verhaltensimitation
Eine Methode zur Generierung von hochwertigem, expertenähnlichem Datenmaterial aus einer begrenzten Menge möglicherweise suboptimaler Daten, um die Leistung von Offline-Verstärkungslernen und Verhaltensimitation zu verbessern.