Eine generalisierte und parametereffiziente Methode zur Erkennung von Gesichtsfälschungen, die die Ausdruckskraft von Transformatoren und die lokalen Priors von CNNs nutzt, um globale und lokale Fälschungshinweise gleichzeitig zu extrahieren.
Durch adversarielle Optimierung der latenten Darstellungen können kontrafaktische Versionen von Fälschungsbildern generiert werden, die weniger Artefakte aufweisen. Dies ermöglicht eine bessere Visualisierung der Fälschungsspuren und führt zu übertragbaren adversariellen Angriffen auf verschiedene Erkennungsmodelle.