Die Studie untersucht, wie die Übertragbarkeit von adversarischen Beispielen durch Veränderungen der Eingabebilder verbessert werden kann. Die Autoren beobachten, dass bestehende Methoden zur Eingabetransformation zu unterschiedlichen Aufmerksamkeitskarten auf verschiedenen Modellen führen, was die Übertragbarkeit begrenzt.
Um dies zu adressieren, schlagen die Autoren einen neuen Ansatz namens "Block Shuffle and Rotation" (BSR) vor. BSR teilt das Eingabebild in Blöcke auf, die dann zufällig verschoben und gedreht werden. Durch diese Transformation werden die intrinsischen Beziehungen im Bild gestört, was zu konsistenteren Aufmerksamkeitskarten über verschiedene Modelle hinweg führt.
Die empirischen Evaluationen auf dem ImageNet-Datensatz zeigen, dass BSR eine deutlich bessere Übertragbarkeit erreicht als bestehende Methoden zur Eingabetransformation, sowohl unter Verwendung eines einzelnen als auch mehrerer Modelle. Darüber hinaus ist BSR kompatibel mit anderen übertragungsbasierten Angriffen und kann deren Leistung weiter verbessern.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Kunyu Wang,X... om arxiv.org 03-26-2024
https://arxiv.org/pdf/2308.10299.pdfDiepere vragen