In dieser Arbeit wird ein Ansatz zur Skalierung der Deepfake-Erkennung vorgestellt, um mit der rasanten Entwicklung von Generative-AI-Technologien Schritt zu halten. Der vorgeschlagene Ansatz, Discrepancy Deepfake Detector (D3) genannt, zielt darauf ab, universelle Artefakte aus mehreren Generatoren zu lernen, indem ein paralleler Netzwerkzweig verwendet wird, der ein verzerrtes Bild als zusätzliches Diskrepanzsignal verwendet.
Die Autoren identifizieren zwei Herausforderungen bei der Skalierung bestehender Deepfake-Erkennungsmethoden auf mehrere Generatoren:
Der vorgeschlagene D3-Ansatz adressiert diese Herausforderungen, indem er die universellen Artefakte zwischen verschiedenen Generatoren nutzt und lernt. Durch den Vergleich des Originalbildes mit seinem patch-gemischten Gegenstück wird das Modell dazu angeregt, stabilere und invariantere Artefakte zu lernen.
Umfangreiche Experimente auf einem skalierten Datensatz zeigen, dass D3 eine um 5,3% höhere OOD-Testgenauigkeit im Vergleich zu state-of-the-art-Methoden erreicht, während die ID-Leistung beibehalten wird. Darüber hinaus erweist sich D3 als robuster gegenüber Bildverzerrungen wie Gaußschem Weichzeichnen und JPEG-Kompression.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yongqi Yang,... lúc arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04584.pdfYêu cầu sâu hơn