Die Studie präsentiert einen neuartigen Beschreibungs-gestützten Korrektor für Benennungseinheiten (DANCER) in der automatischen Spracherkennung (ASR). Dieser Ansatz nutzt Entitätsbeschreibungen, um zusätzliche Informationen bereitzustellen, die dazu beitragen, Probleme der phonetischen Verwechslung bei der ASR-Korrektur von Benennungseinheiten zu mildern.
Der Kern des Verfahrens ist ein effizientes, beschreibungsgestütztes maskiertes Sprachmodell (EDA-MLM), das einen dichten Abrufmechanismus und Entitätsbeschreibungsspeicher verwendet, um sich an domänenspezifische Entitäten anzupassen.
Die Experimente auf den AISHELL-1- und Homophon-Datensätzen zeigen, dass der DANCER-Ansatz die Leistung eines starken Basismodells, des auf phonetischer Editdistanz basierenden Korrektors (PED-NEC), deutlich übertrifft. Insbesondere bei hochgradig phonetisch verwechselbaren Benennungseinheiten bietet DANCER eine erheblich bessere Fehlerreduktion.
To Another Language
from source content
arxiv.org
Djupare frågor