Die Studie präsentiert eine Methode zur effizienten Entfernung von Rauschen aus Bildern, indem die Trainingseffizienz von punktbasierten Diffusionsmodellen verbessert wird.
Zunächst wird die logarithmische Dichte-Fokker-Planck-Gleichung numerisch gelöst, um die Punktbewertung (Score-Funktion) effizient zu berechnen. Diese vorberechnete Punktbewertung wird dann in das Bild eingebettet, indem die Transportgleichung vorwärts in der Zeit gelöst wird. Dadurch kann das neuronale Netzwerk die Punktbewertung in den Merkmalsraum einlernen und die Trainingseffizienz deutlich steigern.
Die numerischen Experimente zeigen, dass die vorgeschlagene Methode eine ähnliche Qualität wie die Standardmethode bei deutlich kürzeren Trainingszeiten erreicht. Auf CIFAR10 und CelebA erzielt die Methode eine 3- bis 5-fache Beschleunigung des Trainings.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Andrew S. Na... alle arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.06661.pdfDomande più approfondite