Die Autoren präsentieren einen neuartigen Ansatz zum Entfernen spezifischer Merkmale aus vortrainierten generativen Modellen wie GANs und VAEs. Im Gegensatz zu herkömmlichen Methoden, bei denen das Ziel des Entfernens eine Teilmenge des Trainingsdatensatzes ist, zielen sie darauf ab, ein bestimmtes Merkmal wie beispielsweise eine Frisur aus Gesichtsbildern zu entfernen.
Der Schlüssel ist es, eine Darstellung des Zielfeatures im latenten Raum zu identifizieren und dann das vortrainierte Modell entsprechend nachzufeinern. Dazu werden zufällig generierte Bilder, die das Zielfeature enthalten, gesammelt und analysiert. Die Autoren zeigen in Experimenten mit MNIST, CelebA und FFHQ, dass die Zielmerkmale erfolgreich entfernt werden, während die Originalqualität der Modelle beibehalten wird. Weitere Experimente mit Angriffen zeigen, dass das entlernte Modell robuster gegen schädliche Parteien ist.
To Another Language
from source content
arxiv.org
Djupare frågor