Enthüllung der Schwachstellen neuronaler Netze bei der Parameteroptimierung und Verteidigung gegen erklärungsbewusste Backdoor-Angriffe
Statistische Analyse der Modellgewichte zeigt, dass Batch-Normalisierung eine Schlüsselrolle bei der Abschwächung von Erklärungsmanipulationen spielt. Eine einfache Verteidigungsmethode, die auf Kanal-basierter Merkmalnormalisierung basiert, kann die Erfolgsrate von Angriffen deutlich reduzieren.