Die Studie untersucht, wie man die nullstellenbasierte Zusammenfassung verbessern kann, indem man sprachunabhängige Darstellungen schafft. Die Autoren zeigen zunächst, dass naiv feinabgestimmte Modelle sehr sprachspezifisch sind, was zu schlechter nullstellenbasierter Leistung führt. Dann schlagen sie zwei Methoden vor, um dies zu beheben:
Query-Key (QK) Feinabstimmung: Nur die Abfrage- und Schlüsselprojektion der Aufmerksamkeitsmodule werden aktualisiert, um die Aufgabenspezifität von den Sprachgenerierungsfähigkeiten zu entkoppeln.
Ausgewogener adversarialer Sprachklassifikator: Anstatt die Kreuzentropie zu verwenden, wird ein KL-Divergenz-basierter Verlust verwendet, um die Darstellungen wirklich sprachunabhängig zu machen.
Die Autoren kombinieren diese beiden Ansätze und zeigen, dass sie die nullstellenbasierte Zusammenfassung sowohl innerhalb einer Sprache als auch über Sprachgrenzen hinweg deutlich verbessern können. Qualitative Analysen zeigen, dass das Entfernen von Sprachidentitätssignalen mit der nullstellenbasierten Leistung korreliert.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Vladimir Sol... klokken arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05720.pdfDypere Spørsmål