核心概念
Das Trimmen des BPE-Vokabulars hat in den meisten Fällen keine positiven Auswirkungen auf die Leistung des Übersetzungsmodells und kann sogar zu erheblichen Leistungseinbußen führen.
摘要
Die Studie untersucht die Auswirkungen des Trimmen des BPE-Vokabulars (Byte-Pair-Encoding) auf die Leistung von Übersetzungsmodellen. Dabei werden verschiedene Einstellungen und Szenarien getestet:
- Trimmen des optimalen Baseline-Modells: In den meisten Fällen führt dies zu einer Verschlechterung der BLEU-Werte.
- Trimmen suboptimaler Baseline-Modelle: Hier kann das Trimmen in einigen Fällen die Leistung etwas verbessern, aber der Effekt ist nicht konsistent.
- Trimmen nur der Quell- oder nur der Zielsprache: Zu starkes Trimmen der Quellsprache hat tendenziell negative Auswirkungen.
- Trimmen so, dass 95% der Token mindestens 100 Mal vorkommen: Auch hier zeigt sich nur ein leicht positiver Effekt für suboptimale Modelle.
- Trimmen mit Erhalt von Endtoken: Kein konsistenter Trend im Vergleich zum regulären Trimmen.
- Vergleich mit kleiner initialisierten Modellen: Letztere schneiden meist besser ab als die gleich großen, getrimmt Modelle.
- Experimente im Joint-Vokabular-Setting: Auch hier überwiegen die negativen Effekte des Trimmen.
- Experimente auf einem größeren Datensatz (Europarl): Die Ergebnisse bestätigen sich auch hier.
Insgesamt zeigt sich, dass das Trimmen des BPE-Vokabulars in den meisten Fällen keine Verbesserung bringt und sogar zu deutlichen Leistungseinbußen führen kann.
統計資料
Nur 88% der Quell- und 70% der Zielsprachentokens im optimalen Baseline-Modell erscheinen mehr als 100 Mal.
Das Trimmen kann zu Einsparungen von bis zu 46,5% der Tokenanzahl in der Quellsprache und 38,7% in der Zielsprache führen.
引述
"Während das Entfernen seltener Subwörter als bewährte Praxis in der maschinellen Übersetzung empfohlen wird, um die Modellgröße zu reduzieren und die Modellleistung durch Robustheit zu verbessern, zeigen unsere Experimente, dass das Vokabulartrimmung über einen großen Bereich von Hyperparameter-Einstellungen hinweg die Leistung nicht verbessert und sogar zu starken Leistungseinbußen neigt."