Die Studie untersucht, ob zusätzlicher Kontext aus dem Quelltext die Verwendung einer menschlichen Referenzübersetzung in der Bewertung von maschinellen Übersetzungssystemen ersetzen kann. Dafür wird eine neue Metrik namens SLIDE (SLIding Document Evaluator) entwickelt, die einen gleitenden Fensteransatz verwendet, um Sätze im Kontext zu bewerten.
Die Ergebnisse zeigen, dass SLIDE die Leistung von referenzfreien Qualitätsschätzungsmetriken deutlich verbessern kann. In einigen Fällen erreicht SLIDE sogar die Leistung referenzbasierter Metriken. Dies deutet darauf hin, dass der Quellkontext ähnliche Informationen wie eine menschliche Referenz liefern kann, um Mehrdeutigkeiten im Quelltext aufzulösen.
Der Ansatz ist besonders relevant für die referenzfreie Bewertung auf Dokumentebene, da SLIDE höherwertige paarweise Systemeinschätzungen liefern kann, ohne auf Referenzübersetzungen angewiesen zu sein, sondern nur Dokumentgrenzannotationen benötigt.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania