Eine generische Methode zur Verbesserung der Leistung bestehender unüberwachter Audiotrennungsverfahren, indem Überwachungssignale aus der Sprachmodaliät gewonnen werden, ohne Zugriff auf Einzelquell-Audiobeispiele während des Trainings.
AV-SUPERB ist ein standardisierter Benchmark, der die Leistungsfähigkeit von Audio-Visuellen Repräsentationsmodellen über verschiedene Sprach- und Audioverarbeitungsaufgaben hinweg umfassend evaluiert.