Erkundung von Jukebox: Eine neuartige Audiorepräsentation für die Musikgenreerkennung in MIR
Diese Studie untersucht die relative Leistungsfähigkeit von auf tiefer Vektorquantisierung (deep VQ) basierenden Audiorepräsentationen und Mel-Spektrogrammen für die Identifizierung von Musikgenres. Die Ergebnisse zeigen, dass Mel-Spektrogramme die auf deep VQ basierenden Repräsentationen übertreffen, da letztere die für die menschliche Wahrnehmung relevanten Feinheiten nicht ausreichend erfassen können.