Die Studie untersucht den Einfluss unterschiedlicher Methoden zum Abrufen von Übersetzungsbeispielen aus einem Übersetzungsspeicher (Translation Memory, TM) auf die Leistung verschiedener neuronaler Übersetzungsarchitekturen.
Zunächst werden verschiedene Komponenten des Retrievalprozesses analysiert, wie Domänenauswahl, Filterung und Ranking. Es werden Metriken wie Abdeckung, Relevanz und Länge der abgerufenen Beispiele betrachtet, um deren Qualität zu bewerten.
Anschließend werden drei neuronale Übersetzungsarchitekturen systematisch mit unterschiedlichen Retrievalmethoden kombiniert und deren Auswirkungen auf die Übersetzungsqualität (BLEU, COMET) untersucht:
Die Experimente zeigen, dass die Wahl der Retrievalmethode einen Einfluss auf die Übersetzungsleistung hat, der je nach Architektur variiert. Optimierungen wie eine höhere Abdeckung der Eingabe oder Diversität der Beispiele erweisen sich als hilfreich, insbesondere wenn die besten Übereinstimmungen von geringer Qualität sind. Außerdem kann eine Vereinfachung des Retrievalprozesses durch Weglassen der Filterung bei einigen Architekturen zu besseren Ergebnissen führen.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Maxime Bouth... ב- arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02835.pdfשאלות מעמיקות