Die Verwendung von mehrfachen Leerzeichensymbolen in RNN-Transducer-Modellen für die Spracherkennung kann die Erkennungsgenauigkeit verbessern und die Inferenzgeschwindigkeit deutlich erhöhen.
Die Anonymisierung von pathologischer Sprache kann die Privatsphäre erheblich verbessern, ohne die diagnostische Nützlichkeit wesentlich zu beeinträchtigen. Die Auswirkungen der Anonymisierung variieren jedoch stark zwischen verschiedenen Sprachstörungen, was den Bedarf an störungsspezifischen Anonymisierungsstrategien unterstreicht.
FastSpell ist ein Sprachidentifikator, der die Entscheidungen eines vorherigen Sprachidentifikators überprüft und verfeinert, um insbesondere ähnliche und verwandte Sprachen besser unterscheiden zu können.
Dieses Papier stellt MultiLS-SP/CA vor, einen neuartigen Datensatz für die lexikalische Vereinfachung in Spanisch und Katalanisch. Dieser Datensatz ist der erste seiner Art in Katalanisch und eine wesentliche Ergänzung zu den spärlichen Daten zur automatischen lexikalischen Vereinfachung, die für Spanisch verfügbar sind.
Die X-LANCE-Gruppe entwickelte leistungsfähige Systeme für die Sprachsynthese, Spracherkennung und Gesangsstimmsynthese, die auf diskreten Spracheinheiten basieren und im Interspeech 2024 Discrete Speech Unit Challenge hervorragende Ergebnisse erzielten.
CodecLM ist ein Framework, das es ermöglicht, maßgeschneiderte synthetische Daten zur Ausrichtung von Sprachmodellen auf verschiedene Zielaufgaben und -modelle zu generieren, ohne dass menschliche Annotationen erforderlich sind.
Die Verwendung von Sprachsignalen kann die Leistung der automatischen Diakritikenwiederherstellung für Sprachdatensätze im Vergleich zu rein textbasierten Modellen deutlich verbessern.
Eine adaptive Kanalzusammenstellung, die die Auswirkungen von Aktivierungsausreißern auf die Quantisierung reduziert, sowie eine effiziente gradientenbasierte Fehlerkorrektur, die die Leistung quantisierter großer Sprachmodelle erheblich verbessert.
Durch das Beibehalten der Aufmerksamkeitssenken (einige Anfangstokens) zusammen mit dem gleitenden Fenstercache können Sprachmodelle stabil und effizient für Texte mit unbegrenzter Länge eingesetzt werden.
EASSE-multi ist ein Rahmenwerk, das die automatische Bewertung der Satzverein- fachung für andere Sprachen als Englisch erleichtert. Im Vergleich zum ursprünglichen EASSE-Rahmenwerk konzentriert sich EASSE-multi nicht nur auf Englisch, sondern enthält Tokenizer und Versionen von Textverein- fachungsbewertungsmetriken, die für mehrere Sprachen geeignet sind.