Unüberwachtes Mehrkanal-Quellentrennung und -Anpassung für Sprachaufnahmen in realen Umgebungen
Dieser Artikel erweitert den kürzlich vorgestellten Mixture Invariant Training (MixIT)-Algorithmus, um unüberwachtes Lernen im Mehrkanal-Kontext zu ermöglichen. Das Modell kann sowohl überwacht als auch unüberwacht auf Sprachaufnahmen aus realen Umgebungen trainiert werden und erzielt so bessere Trennleistung als Modelle, die nur auf synthetischen Daten trainiert wurden.