Skalierung der Vorverarbeitung der Videozusammenfassung mit großen Sprachmodellen
Durch die Nutzung großer Sprachmodelle als Orakel-Zusammenfasser wird ein automatischer und skalierbarer Ansatz zur Erstellung eines großen Datensatzes für die Vorverarbeitung der Videozusammenfassung vorgestellt.