Centrala begrepp
Untersuchung von Techniken der Neuronalen Maschinellen Übersetzung, um automatische Übersetzungssysteme zwischen Deutsch und Bairisch zu entwickeln, wobei Datenmangel und Parameterempfindlichkeit bei Sprachen mit geringen Ressourcen berücksichtigt werden.
Sammanfattning
Die Studie untersucht den Einsatz von Techniken der Neuronalen Maschinellen Übersetzung (NMT) zur Entwicklung automatischer Übersetzungssysteme zwischen Deutsch und Bairisch, einer Sprache mit geringen Ressourcen.
Zunächst wird ein einfaches Transformer-Modell als Baseline-System trainiert. Anschließend wird Back-translation angewendet, um den Trainingsdatensatz zu erweitern. Schließlich wird ein Transfer-Learning-Ansatz mit Deutsch-Französisch als Elternmodell getestet.
Die Evaluierung erfolgt anhand einer Kombination von BLEU, chrF und TER-Metriken. Die statistischen Signifikanztests zeigen, dass die Baseline-Systeme überraschend gut abschneiden und Back-translation zu einer signifikanten Verbesserung führt. Darüber hinaus wird eine qualitative Analyse der Übersetzungsfehler und Systemlimitationen präsentiert.
Die Ergebnisse deuten darauf hin, dass die Ähnlichkeit zwischen den Quell- und Zielsprachen einen positiven Einfluss auf die Übersetzungsqualität hat. Back-translation trägt ebenfalls signifikant zur Verbesserung bei, während der Transfer-Learning-Ansatz zwar Verbesserungen zeigt, aber nicht an die anderen Systeme heranreicht.
Statistik
Die Baseline-Systeme erreichen BLEU-Werte zwischen 61 und 66, chrF-Werte zwischen 74 und 78 und TER-Werte zwischen 33 und 36.
Die Back-translation-Systeme zeigen eine signifikante Verbesserung mit BLEU-Werten zwischen 63 und 73, chrF-Werten zwischen 76 und 83 und TER-Werten zwischen 25 und 32.
Die Transfer-Learning-Systeme erreichen BLEU-Werte zwischen 48 und 54, chrF-Werte zwischen 64 und 71 und TER-Werte zwischen 42 und 44.
Citat
"Untersuchung von Techniken der Neuronalen Maschinellen Übersetzung, um automatische Übersetzungssysteme zwischen Deutsch und Bairisch zu entwickeln, wobei Datenmangel und Parameterempfindlichkeit bei Sprachen mit geringen Ressourcen berücksichtigt werden."
"Die Ergebnisse deuten darauf hin, dass die Ähnlichkeit zwischen den Quell- und Zielsprachen einen positiven Einfluss auf die Übersetzungsqualität hat. Back-translation trägt ebenfalls signifikant zur Verbesserung bei, während der Transfer-Learning-Ansatz zwar Verbesserungen zeigt, aber nicht an die anderen Systeme heranreicht."