Der Artikel präsentiert Progressive Conditional Diffusion Models (PCDMs), ein dreistufiges Verfahren zur poseguided Bildsynthese von Personen.
In der ersten Stufe wird ein einfaches bedingtes Diffusionsmodell verwendet, um die globalen Merkmale des Zielbildes vorherzusagen, indem die globale Ausrichtungsbeziehung zwischen Positionskoordinaten und Bilderscheinung genutzt wird.
In der zweiten Stufe wird ein dichter Zusammenhang zwischen Quell- und Zielbild unter Verwendung der globalen Merkmale aus der vorherigen Stufe hergestellt. Ein bedingtes Diffusionsmodell für Inpainting wird vorgeschlagen, um die Kontextmerkmale weiter anzupassen und ein grobkörniges Personenbild zu erzeugen.
In der dritten Stufe wird ein verfeinerndes bedingtes Diffusionsmodell verwendet, um das grob erzeugte Bild aus der vorherigen Stufe als Bedingung zu nutzen, um die Texturwiederherstellung zu erreichen und die Konsistenz der Feindetails zu verbessern.
Die drei Stufen der PCDMs arbeiten schrittweise zusammen, um das endgültige hochwertige und realistische synthetisierte Bild zu erzeugen. Sowohl qualitative als auch quantitative Ergebnisse zeigen die Konsistenz und Fotorealität unserer vorgeschlagenen PCDMs in herausfordernden Szenarien.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Fei Shen,Hu ... pada arxiv.org 03-14-2024
https://arxiv.org/pdf/2310.06313.pdfPertanyaan yang Lebih Dalam