Effiziente und langfristige neuronale Mehrkanal-Sprachverbesserung für statische und bewegte Sprecher
Die vorgeschlagene Online-SpatialNet-Architektur, insbesondere die Mamba-Variante, erzielt hervorragende Leistungen bei der Sprachverbesserung in Echtzeit für lange Audioströme und sowohl für statische als auch für bewegte Sprecher.