Der Artikel zeigt, dass reines Feintuning eine leistungsfähige Methode zur Bearbeitung von Sprachmodellen sein kann, wenn man zwei wichtige Änderungen vornimmt:
Optimierung der bedingten Wahrscheinlichkeit anstelle der vollen Wahrscheinlichkeit, um die Modifikationen fokussierter zu gestalten.
Erweiterung der Trainingsdaten um zufällige Paraphrasen und Fakten, um Generalisierung und Lokalität zu fördern.
Diese einfachen Änderungen reichen aus, damit reines Feintuning oft die Leistung spezialisierter Editoren in Bezug auf den Editierwert erreicht oder sogar übertrifft, sowohl bei Massen- als auch bei Einzelbearbeitungen.
Die Autoren argumentieren, dass Feintuning eine einfache, modellunabhängige Methode ist, die von Fortschritten im standardmäßigen Training profitieren kann. Im Gegensatz dazu erfordern spezialisierte Editoren eine Reihe von Annahmen, die in anderen Kontexten möglicherweise nicht erfüllt sind.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Govind Ganga... a las arxiv.org 03-12-2024
https://arxiv.org/pdf/2402.11078.pdfConsultas más profundas