Concetti Chiave
Unsere audioqualitätsbasierte Multi-Strategie für die Zielrednerextraktion in der MISP 2023 Challenge verbessert die Spracherkennungssysteme.
Statistiche
Unsere Methode erreicht einen CER von 24,2% auf dem Dev-Set und 33,2% auf dem Eval-Set.
Citazioni
"Unsere Methode erreicht eine Zeichenfehlerrate (CER) von 24,2% bzw. 33,2% auf dem Dev- und Eval-Set und belegt damit den zweiten Platz in der Challenge."