Multimodales, multigenres und vielseitiges audiovisuelles akademisches Vortragsdatensatz (M3AV): Ein umfassender Datensatz zur Förderung der Erkennung und des Verständnisses multimodaler akademischer Inhalte
Der M3AV-Datensatz bietet einen umfassenden Satz von annotierten akademischen Vortragsvideos aus verschiedenen Fachbereichen, der als Benchmark für die Entwicklung von KI-Systemen dient, die multimodale Inhalte erkennen und akademisches Wissen verstehen können.