核心概念
Durch Lösen der logarithmischen Dichte-Fokker-Planck-Gleichung numerisch und Einbettung der berechneten Punktbewertung in das Bild kann die Trainingseffizienz von punktbasierten Diffusionsmodellen deutlich verbessert werden.
摘要
Die Studie präsentiert eine Methode zur effizienten Entfernung von Rauschen aus Bildern, indem die Trainingseffizienz von punktbasierten Diffusionsmodellen verbessert wird.
Zunächst wird die logarithmische Dichte-Fokker-Planck-Gleichung numerisch gelöst, um die Punktbewertung (Score-Funktion) effizient zu berechnen. Diese vorberechnete Punktbewertung wird dann in das Bild eingebettet, indem die Transportgleichung vorwärts in der Zeit gelöst wird. Dadurch kann das neuronale Netzwerk die Punktbewertung in den Merkmalsraum einlernen und die Trainingseffizienz deutlich steigern.
Die numerischen Experimente zeigen, dass die vorgeschlagene Methode eine ähnliche Qualität wie die Standardmethode bei deutlich kürzeren Trainingszeiten erreicht. Auf CIFAR10 und CelebA erzielt die Methode eine 3- bis 5-fache Beschleunigung des Trainings.
統計資料
Die Autoren berichten folgende wichtige Kennzahlen:
Auf CIFAR10 erreicht die vorgeschlagene Methode eine SSIM von 0,99 in 26,98 Sekunden, während DDPM 139,63 Sekunden und DDIM 182,53 Sekunden benötigen.
Auf CelebA erreicht die vorgeschlagene Methode eine SSIM von 0,95 in 105,41 Sekunden, während DDPM 601,27 Sekunden benötigt.
引述
"Durch Lösen der logarithmischen Dichte-Fokker-Planck-Gleichung numerisch und Einbettung der berechneten Punktbewertung in das Bild kann die Trainingseffizienz von punktbasierten Diffusionsmodellen deutlich verbessert werden."
"Die numerischen Experimente zeigen, dass die vorgeschlagene Methode eine ähnliche Qualität wie die Standardmethode bei deutlich kürzeren Trainingszeiten erreicht."