Die Studie untersucht den Einfluss unterschiedlicher Methoden zum Abrufen von Übersetzungsbeispielen aus einem Übersetzungsspeicher (Translation Memory, TM) auf die Leistung verschiedener neuronaler Übersetzungsarchitekturen.
Zunächst werden verschiedene Komponenten des Retrievalprozesses analysiert, wie Domänenauswahl, Filterung und Ranking. Es werden Metriken wie Abdeckung, Relevanz und Länge der abgerufenen Beispiele betrachtet, um deren Qualität zu bewerten.
Anschließend werden drei neuronale Übersetzungsarchitekturen systematisch mit unterschiedlichen Retrievalmethoden kombiniert und deren Auswirkungen auf die Übersetzungsqualität (BLEU, COMET) untersucht:
Die Experimente zeigen, dass die Wahl der Retrievalmethode einen Einfluss auf die Übersetzungsleistung hat, der je nach Architektur variiert. Optimierungen wie eine höhere Abdeckung der Eingabe oder Diversität der Beispiele erweisen sich als hilfreich, insbesondere wenn die besten Übereinstimmungen von geringer Qualität sind. Außerdem kann eine Vereinfachung des Retrievalprozesses durch Weglassen der Filterung bei einigen Architekturen zu besseren Ergebnissen führen.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Maxime Bouth... kl. arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02835.pdfDybere Forespørgsler