Die Studie untersucht den Mechanismus der Dual-BN in der hybriden adversariellen Trainingsmethode (Hybrid-AT) und ihre zugrunde liegende Rechtfertigung.
Zunächst wird gezeigt, dass das Training mit Cross-BN (d.h. Verwendung von BNclean für die adversarielle Zweig oder BNadv für den sauberen Zweig) zu vergleichbaren Ergebnissen wie das Training mit Selbst-BN führt. Dies steht im Widerspruch zu den Behauptungen früherer Arbeiten, die die Notwendigkeit der Dual-BN betonen.
Um den Mechanismus der Dual-BN besser zu verstehen, wird untersucht, wie sich die Trennung der Normalisierungsstatistiken (NS) und der Skalierungs- und Verschiebungsparameter (AP) auf die Leistung auswirken. Die Ergebnisse zeigen, dass die Trennung der AP eine ähnliche Leistung wie die originale Dual-BN erzielt, während die Trennung der NS unter bestimmten Bedingungen (z.B. kleine Störungen) ebenfalls vergleichbare Robustheit erreichen kann.
Darüber hinaus wird der Domänenunterschied zwischen adversariellen und sauberen Proben untersucht. Es wird festgestellt, dass dieser Unterschied nicht so groß ist, wie in früheren Arbeiten behauptet. Unter der gleichen Störungs-/Rauschgröße gibt es keinen signifikanten Unterschied zwischen dem adversariellen-sauberen Domänenunterschied und dem verrauschten-sauberen Gegenstück.
Basierend auf diesen Erkenntnissen wird eine Zwei-Aufgaben-Hypothese vorgeschlagen, um die Dual-BN in Hybrid-AT zu erklären. Diese Hypothese dient als empirische Grundlage und einheitlicher Rahmen für Verbesserungen des hybriden adversariellen Trainings und verbindet verschiedene Methoden wie Dual-BN, Dual-Linear, Adapter und Trades-AT.
Schließlich wird untersucht, wie Dual-BN sich auf die Robustheit während der Inferenz auswirkt. Es wird festgestellt, dass die AP die Robustheit bestimmen.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Chenshuang Z... at arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19150.pdfDeeper Inquiries