Sichere Feinabstimmung von vortrainierten Encodern gegen Adversarial Examples
Wir präsentieren Gen-AF, einen zweistufigen Ansatz zur adversariellen Feinabstimmung, um die Robustheit von Downstream-Modellen gegen Downstream-agnostische Adversarial Examples zu verbessern, während gleichzeitig die inhärente Generalisierungsfähigkeit des vortrainierten Encoders erhalten bleibt.