Die Studie stellt eine neuartige Trainingsstrategie namens "phasenweise Datenerweiterung" vor, die speziell für ein wahrscheinlichkeitsbasiertes generatives Modell (PC-VQ2) mit begrenzten Datensätzen entwickelt wurde.
Generative Modelle sind zwar in der Lage, realistische Bilder zu erstellen, hängen aber stark von umfangreichen Trainingsdatensätzen ab. Bestehende dateneffiziente Methoden konzentrieren sich hauptsächlich auf GAN-Architekturen, lassen aber andere Arten generativer Modelle außen vor.
Die phasenweise Datenerweiterung optimiert das Training, indem die Intensität der Datenerweiterung im Laufe der Lernphasen schrittweise reduziert wird. Dadurch kann das Modell effizient aus begrenzten Daten lernen, ohne die ursprüngliche Datenverteilung zu verändern.
Angewendet auf das PC-VQ2-Modell, das PixelCNNs mit VQ-VAE-2 integriert, zeigt der Ansatz in quantitativen und qualitativen Bewertungen über verschiedene Datensätze hinweg eine überlegene Leistung im Vergleich zur herkömmlichen Datenerweiterung.
Dies stellt einen wichtigen Schritt nach vorne bei der effizienten Ausbildung wahrscheinlichkeitsbasierter Modelle dar und erweitert die Nützlichkeit von Datenerweiterungstechniken über reine GAN-Modelle hinaus.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yuta Mimura kl. arxiv.org 03-19-2024
https://arxiv.org/pdf/2305.12681.pdfDybere Forespørgsler