Die Autoren analysieren zunächst die von Diffusionsmodellen erzeugten Daten und identifizieren Repräsentativität und Diversität als Schlüsselfaktoren für effektive Ersatzdatensätze. Daraufhin entwerfen sie zusätzliche Minimax-Kriterien für das Diffusionstraining, um diese beiden Aspekte gezielt zu verbessern.
Die theoretische Analyse zeigt, dass die vorgeschlagenen Minimax-Kriterien ein klar definiertes Problem lösen, ohne Abstriche bei der Qualität der einzelnen Datenpunkte machen zu müssen.
Umfangreiche Experimente auf verschiedenen ImageNet-Teilmengen belegen, dass die vorgeschlagene Methode den aktuellen Stand der Technik deutlich übertrifft, bei gleichzeitig deutlich reduziertem Rechenaufwand. Insbesondere auf der herausfordernden ImageWoof-Teilmenge erzielt die Methode einen Leistungsvorsprung von bis zu 8,1% gegenüber der zweitbesten Methode.
Die Visualisierungen zeigen, dass die Minimax-Diffusion die Repräsentativität und Diversität der generierten Bilder signifikant verbessert, was die überlegene Leistung erklärt.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Jianyang Gu,... في arxiv.org 03-26-2024
https://arxiv.org/pdf/2311.15529.pdfاستفسارات أعمق