Der Artikel präsentiert Progressive Conditional Diffusion Models (PCDMs), ein dreistufiges Verfahren zur poseguided Bildsynthese von Personen.
In der ersten Stufe wird ein einfaches bedingtes Diffusionsmodell verwendet, um die globalen Merkmale des Zielbildes vorherzusagen, indem die globale Ausrichtungsbeziehung zwischen Positionskoordinaten und Bilderscheinung genutzt wird.
In der zweiten Stufe wird ein dichter Zusammenhang zwischen Quell- und Zielbild unter Verwendung der globalen Merkmale aus der vorherigen Stufe hergestellt. Ein bedingtes Diffusionsmodell für Inpainting wird vorgeschlagen, um die Kontextmerkmale weiter anzupassen und ein grobkörniges Personenbild zu erzeugen.
In der dritten Stufe wird ein verfeinerndes bedingtes Diffusionsmodell verwendet, um das grob erzeugte Bild aus der vorherigen Stufe als Bedingung zu nutzen, um die Texturwiederherstellung zu erreichen und die Konsistenz der Feindetails zu verbessern.
Die drei Stufen der PCDMs arbeiten schrittweise zusammen, um das endgültige hochwertige und realistische synthetisierte Bild zu erzeugen. Sowohl qualitative als auch quantitative Ergebnisse zeigen die Konsistenz und Fotorealität unserer vorgeschlagenen PCDMs in herausfordernden Szenarien.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문