Effiziente Injektion von Backdoors in Große Sprachmodelle durch Modellbearbeitung
Durch die Neuformulierung der Backdoor-Injektion als ein leichtgewichtiges Wissensbearbeitungsproblem präsentiert BadEdit einen effizienten Rahmen, um Backdoors in vortrainierte Große Sprachmodelle einzubringen, ohne deren Gesamtleistung zu beeinträchtigen.