Sicherheitsoptimierte LLaMAs: Lehren aus der Verbesserung der Sicherheit großer Sprachmodelle, die Anweisungen befolgen
Die Hinzufügung einer kleinen Anzahl von Sicherheitsbeispielen (einige hundert) während des Feinabstimmungsprozesses kann die Sicherheit von instruktionsbasierten Sprachmodellen erheblich verbessern, ohne ihre allgemeine Leistung und Funktionalität zu beeinträchtigen.