Moderne Text-zu-Bild-Diffusionsmodelle können Bilder mit bemerkenswerter Realität und Kreativität erzeugen. Diese Fortschritte haben die Forschung zur Erkennung und Attribution von Fake-Bildern angeregt, aber frühere Studien haben die praktischen und wissenschaftlichen Dimensionen dieser Aufgabe nicht vollständig untersucht. Unsere Analyse zeigt, dass selbst subtile Variationen im Erzeugungsprozess bis zu einem gewissen Grad erkennbar sind und dass Bildattribute über den hochfrequenten Bereich hinausgehen und auch mittlere Darstellungsebenen umfassen.
AEROBLADE, eine einfache und trainingsfreie Methode, kann effektiv Bilder erkennen, die von modernen Latent-Diffusion-Modellen wie Stable Diffusion und Midjourney generiert wurden, indem es den Rekonstruktionsfehler des Autoencoders ausnutzt.
Eine neuartige Methode zur effizienten Erkennung von Diffusions-generierten Bildern, die den Latenten Rekonstruktionsfehler (LaRE) als diskriminatives Merkmal nutzt und eine fehlergesteuerte Merkmalsverfeinerung durchführt, um die Unterscheidbarkeit zwischen echten und gefälschten Bildern zu verbessern.
Echte Bilder besitzen stabile statistische Eigenschaften, die als natürliche Spuren genutzt werden können, um Fake-Bilder, die mit verschiedenen Generativen Modellen erstellt wurden, zuverlässig zu erkennen.