Die Autoren analysieren zunächst die von Diffusionsmodellen erzeugten Daten und identifizieren Repräsentativität und Diversität als Schlüsselfaktoren für effektive Ersatzdatensätze. Daraufhin entwerfen sie zusätzliche Minimax-Kriterien für das Diffusionstraining, um diese beiden Aspekte gezielt zu verbessern.
Die theoretische Analyse zeigt, dass die vorgeschlagenen Minimax-Kriterien ein klar definiertes Problem lösen, ohne Abstriche bei der Qualität der einzelnen Datenpunkte machen zu müssen.
Umfangreiche Experimente auf verschiedenen ImageNet-Teilmengen belegen, dass die vorgeschlagene Methode den aktuellen Stand der Technik deutlich übertrifft, bei gleichzeitig deutlich reduziertem Rechenaufwand. Insbesondere auf der herausfordernden ImageWoof-Teilmenge erzielt die Methode einen Leistungsvorsprung von bis zu 8,1% gegenüber der zweitbesten Methode.
Die Visualisierungen zeigen, dass die Minimax-Diffusion die Repräsentativität und Diversität der generierten Bilder signifikant verbessert, was die überlegene Leistung erklärt.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Jianyang Gu,... a las arxiv.org 03-26-2024
https://arxiv.org/pdf/2311.15529.pdfConsultas más profundas