Core Concepts
Fehlausrichtung zwischen Schatten- und Zielmodellen ist der Hauptgrund für die suboptimale Leistung von White-Box-Mitgliedschaftsrückschlussangriffen. Durch Neuausrichtungstechniken kann die Leistung dieser Angriffe deutlich verbessert werden.
Abstract
Die Studie untersucht systematisch die Ursachen für die Fehlausrichtung von Schattenmodellen und zeigt, dass die Verwendung einer anderen Gewichtsinitialisierung als das Zielmodell der Hauptgrund dafür ist. Andere Faktoren wie unterschiedliche Datensätze, Batchreihenfolge oder Dropout-Auswahl haben dagegen nur einen geringen Einfluss.
Die Autoren erweitern Neuausrichtungstechniken aus der Modellverschmelzungsliteratur auf den Kontext von Schattenmodellen und zeigen, dass diese die gemessene Fehlausrichtung zwischen Ziel- und Schattenmodellen deutlich reduzieren können.
Eine umfassende Evaluierung von White-Box-Mitgliedschaftsrückschlussangriffen zeigt, dass Angriffe, die auf Aktivierungen interner Schichten basieren, stark unter der Fehlausrichtung der Schattenmodelle leiden, während gradientenbasierte Angriffe nur manchmal signifikant betroffen sind. Die Neuausrichtung der Schattenmodelle verbessert die Leistung der ersten Angriffe deutlich und manchmal auch die der letzteren.
Insgesamt zeigen die Ergebnisse, dass die Bereitstellung von Modellen auf Endgeräten die Angriffsfläche erhöht und dass die neu verfügbaren Informationen vom Angreifer genutzt werden können. Zudem sollten Risikobewertungen der Privatsphäre im White-Box-Setting die Symmetrien der Zielmodellarchitektur berücksichtigen, wenn der Angriff entworfen wird. Neuausrichtungstechniken bieten eine einfache und kostengünstige Möglichkeit, dies zu tun, ohne die Angriffsleistung zu beeinflussen und sie in einigen Fällen sogar zu verbessern.
Stats
Die Verwendung einer anderen Gewichtsinitialisierung als das Zielmodell führt zu einer Fehlausrichtung der Schattenmodelle, die vergleichbar ist mit dem Anlegen einer zufälligen Permutation der Neuronen (Filter) im Zielmodell.
Andere Faktoren wie unterschiedliche Datensätze, Batchreihenfolge oder Dropout-Auswahl haben nur einen geringen Einfluss auf die Fehlausrichtung.
Quotes
Keine relevanten Zitate identifiziert.