Core Concepts
Viele Datensätze für die Erkennung von KI-generierten Bildern enthalten Verzerrungen in Bezug auf JPEG-Kompression und Bildgröße, die von Detektoren ausgenutzt werden. Das Entfernen dieser Verzerrungen führt zu einer deutlichen Verbesserung der Leistung über verschiedene Generatoren hinweg.
Abstract
Die Studie untersucht, dass viele Datensätze für die Erkennung von KI-generierten Bildern Verzerrungen in Bezug auf JPEG-Kompression und Bildgröße aufweisen, die von Detektoren ausgenutzt werden.
Experimente mit dem GenImage-Datensatz zeigen, dass Detektoren, die auf diesen Datensätzen trainiert werden, tatsächlich Informationen über JPEG-Kompression und Bildgröße lernen, anstatt sich auf generatorspezifische Artefakte zu konzentrieren. Komprimierte KI-generierte Bilder werden häufiger als natürlich eingestuft, und Detektoren zeigen eine schlechtere Leistung auf natürlichen Bildern, die ähnliche Größen wie die generierten Bilder haben.
Um diese Verzerrungen zu beseitigen, wurden die Datensätze so angepasst, dass alle Bilder mit einem JPEG-Qualitätsfaktor von 96 komprimiert wurden und die Größen der natürlichen und generierten Bilder angeglichen wurden. Die Ergebnisse zeigen eine deutliche Verbesserung der Leistung über verschiedene Generatoren hinweg, mit einem Anstieg von über 11 Prozentpunkten für ResNet50- und Swin-T-Detektoren. Darüber hinaus werden die Detektoren robuster gegenüber Verzerrungen, da sie nun die eigentliche Aufgabe der Erkennung generatorspezifischer Artefakte lernen.
Stats
Die Mehrheit der Bilder im ImageNet-Datensatz, der als Quelle für natürliche Bilder in GenImage dient, ist mit einem JPEG-Qualitätsfaktor von 96 komprimiert.
Die generierten Bilder in GenImage sind hingegen unkomprimiert im PNG-Format gespeichert.
Quotes
Keine relevanten Zitate gefunden.