Core Concepts
Trotz der theoretischen Unzulänglichkeit von Rückübersetzung zeigt sie in der Praxis große Erfolge bei der unüberwachten maschinellen Übersetzung. Die Studie untersucht, welche sprachlichen Eigenschaften für diesen Erfolg verantwortlich sind.
Abstract
Die Studie untersucht systematisch den Einfluss von lexikalischen, syntaktischen und semantischen Eigenschaften auf die Leistung von Rückübersetzung bei der unüberwachten maschinellen Übersetzung.
Zunächst zeigt sich, dass Rückübersetzung theoretisch nicht ausreicht, um zwei Sprachen ohne Aufsicht aufeinander abzustimmen. Selbst wenn zusätzliche Ziele wie Filterung oder denoising autoencoding hinzugefügt werden, ist die Methode nicht ausreichend.
In kontrollierten Experimenten mit künstlichen Sprachen wird untersucht, welche Sprachähnlichkeiten den praktischen Erfolg von Rückübersetzung erklären können:
Grammatikalische Ähnlichkeit zwischen Sprachen erleichtert die Übersetzung, wenn der Wortschatz identisch ist.
Unterschiedliche Wortschätze untergraben den Erfolg von Rückübersetzung jedoch vollständig, auch bei ähnlicher Grammatik.
Weder gemeinsame Wörter ("Ankerpunkte") noch ähnliche Worthäufigkeitsverteilungen über Sprachen hinweg sind ausreichend, um Rückübersetzung zum Erfolg zu verhelfen.
Eine minimale Menge an Übersetzungsbeispielen oder ein vollständiges zweisprachiges Wörterbuch stellen jedoch eine entscheidende Hilfe dar.
Einfache semantische Ähnlichkeiten in Form von Wortfeldern verbessern die Leistung von Rückübersetzung ebenfalls, was darauf hindeutet, dass tiefere semantische Ähnlichkeiten zwischen Sprachen der Schlüssel zum Erfolg sind.
Insgesamt zeigt die Studie, dass der praktische Erfolg von Rückübersetzung bei der unüberwachten maschinellen Übersetzung keineswegs analytisch garantiert war. Stattdessen ist er ein weiterer Beweis für die tiefen Ähnlichkeiten zwischen den Sprachen der Welt, die es zu identifizieren gilt.
Stats
Rückübersetzung ist theoretisch nicht ausreichend, um zwei Sprachen ohne Aufsicht aufeinander abzustimmen.
Grammatikalische Ähnlichkeit zwischen Sprachen erleichtert die Übersetzung, wenn der Wortschatz identisch ist.
Unterschiedliche Wortschätze untergraben den Erfolg von Rückübersetzung vollständig, auch bei ähnlicher Grammatik.
Weder gemeinsame Wörter noch ähnliche Worthäufigkeitsverteilungen sind ausreichend, um Rückübersetzung zum Erfolg zu verhelfen.
Eine minimale Menge an Übersetzungsbeispielen oder ein vollständiges zweisprachiges Wörterbuch stellen eine entscheidende Hilfe dar.
Einfache semantische Ähnlichkeiten in Form von Wortfeldern verbessern die Leistung von Rückübersetzung.
Quotes
"Trotz der theoretischen Unzulänglichkeit von Rückübersetzung zeigt sie in der Praxis große Erfolge bei der unüberwachten maschinellen Übersetzung."
"Der praktische Erfolg von Rückübersetzung bei der unüberwachten maschinellen Übersetzung war keineswegs analytisch garantiert."