Verdeckte Composite-Backdoor-Angriffe gegen große Sprachmodelle
Wir präsentieren einen neuartigen Composite-Backdoor-Angriff (CBA) gegen große Sprachmodelle, bei dem mehrere Triggerschlüssel in verschiedenen Eingabekomponenten verteilt werden. Dieser Angriff ist stealthier als herkömmliche Backdoor-Angriffe und kann hohe Angriffserfolgssätze bei gleichzeitig niedriger Fehlauslösungsrate und geringer Beeinträchtigung der Modellgenauigkeit erreichen.