Core Concepts
Eine automatisierte Datenkurationspipeline namens CLEAR kann die Leistung von Sprachmodellen durch Filterung und Korrektur von Trainingsdaten deutlich verbessern, ohne dass zusätzliche Feinabstimmungsberechnungen erforderlich sind.
Abstract
Die Studie präsentiert eine automatisierte Datenkurationspipeline namens CLEAR, die die Leistung von Sprachmodellen bei der Feinabstimmung auf instruktionsbasierten Datensätzen verbessern kann.
Der erste Schritt, Auto-Filter, entfernt Datenpunkte mit niedriger Konfidenz aus dem Trainingsdatensatz, basierend auf Schätzungen der Antwortqualität durch den Sprachmodell-Konfidenzschätzer BSDetector. Dieser Schritt führt bereits zu deutlichen Leistungssteigerungen ohne zusätzliche Feinabstimmungsberechnungen.
Der zweite Schritt, Auto-Correct, nutzt das feinabgestimmte Sprachmodell, um bestimmte Antworten im Originaldatensatz zu korrigieren, bei denen das Modell eine höhere Konfidenz als die Originaldaten aufweist. Eine erneute Feinabstimmung des Modells auf diesem korrigierten Datensatz führt zu weiteren Leistungssteigerungen.
Die Experimente zeigen, dass diese datenzentrische Herangehensweise die Leistung von Sprachmodellen wie GPT-3.5 und Llama-2 über verschiedene Datensätze und Feinabstimmungsverfahren hinweg konsistent verbessert, ohne dass leistungsfähigere Sprachmodelle wie GPT-4 in den Prozess einbezogen werden müssen.
Stats
Die Teilnahme an öffentlichen religiösen Riten zeigte ein persönliches Engagement für die Gemeinschaft und ihre Werte.
Aufgrund des US-Gesetzes wurden die Uiguren nicht nach China abgeschoben, sondern stattdessen nach Bermuda verlegt.
Während der Herrschaft der Jagiellonendynastie wurden nur Mitglieder dieser Königsfamilie gewählt.
Quotes
"Automatisierte Datenkuration für robuste Feinabstimmung von Sprachmodellen"
"Erfolg in realen KI-Projekten erfordert in der Regel sowohl Modellierungs- als auch Datenzentrische Ansätze."
"CLEAR ist ein umfassendes Framework, das die Leistung eines Datensatzes (und die Ausgaben des trainierten Modells) ohne zusätzliche Feinabstimmungsberechnungen verbessern kann."