Verbessern der Robustheit großer Sprachmodelle durch Konsistenzausrichtung
Großen Sprachmodellen fehlt es noch an Robustheit, da sie bei geringfügigen Änderungen der formulierten Anweisungen stark inkonsistente Antworten generieren können. Dieser Artikel präsentiert ein zweistufiges Trainingsverfahren, das die Robustheit durch instruktionserweiterte überwachte Feinabstimmung und Konsistenzausrichtung verbessert.