In dieser Arbeit tragen wir zur Bereicherung des Satzes öffentlich verfügbarer Benchmarks für das Portugiesische bei, indem wir uns auf maschinelle Übersetzung von Aufgaben aus den bekannten GLUE- und SuperGLUE-Benchmarks stützen, die ursprünglich für Englisch entwickelt wurden. Wir diskutieren die bei unserem Ansatz auftretenden Probleme und stellen Versionen mehrerer Aufgaben für das europäische (pt-PT) und brasilianische (pt-BR) Portugiesisch bereit, die wir insgesamt PORTULAN ExtraGLUE nennen.
Als praktische Validierung dieser Datensätze umfassen wir für die meisten Aufgaben eine experimentelle Auswertung verschiedener feinabgestimmter portugiesischer Sprachmodelle. Daher sind dies für viele der Aufgaben die ersten Modelle, die sich damit befassen, und wir tragen somit die ersten Baselines dafür bei. Zu diesem Zweck greifen wir auf das Albertina-Encodermodell und den Low-Rank-Adaptionsansatz zurück. Die resultierenden feinabgestimmten Sprachmodelle für diese Aufgaben werden als Open Source unter einer offenen Lizenz verteilt.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Tomá... lúc arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05333.pdfYêu cầu sâu hơn