Die Studie präsentiert eine neue Methode für die Erkennung anomaler Geräusche in unbekannten Maschinentypen durch metadatenunterstützte Audioerzeugung.
ASiT ist ein neuartiges selbstüberwachtes Lernframework, das lokale und globale Kontextinformationen für Audio-Spektrogramme erfasst und die Leistung in verschiedenen Audio- und Sprachklassifikationstasks verbessert.
RFWave ist ein innovativer Ansatz zur Rekonstruktion hochwertiger Audio-Wellenformen mit hoher Effizienz.
Unsere audioqualitätsbasierte Multi-Strategie für die Zielrednerextraktion in der MISP 2023 Challenge verbessert die Spracherkennungssysteme.
Die Bedeutung der Wahl des AR-Modellschätzers und die Eignung der neuen lückenweisen Janssen-Methode.
CrossNet ist eine innovative neuronale Architektur für die Lautsprecherseparation und -verbesserung in geräuschvollen und halligen Umgebungen.
Untersuchung der Auswirkungen verschiedener Regularisierungsmethoden auf die Leistung von Ambisonics-Netzwerken.