uaMix-MAE: Effizientes Feinabstimmen von vortrainierten Audio-Transformatoren mit unüberwachten Audio-Mischungen
uaMix-MAE ist eine effiziente Kontrastiv-Abstimmungsstrategie, die unüberwachte Audio-Mischungen nutzt, um die Darstellungen vortrainierter Masked Audio Encoder semantisch auszurichten und so die Anpassung an nachgelagerte Aufgaben mit begrenzten beschrifteten Daten zu verbessern.