Generierung von modischen Bildern durch multimodale Steuerung von Latent-Diffusions-Modellen
Das Ziel ist es, neue Bilder von Personen in Modekleidung zu generieren, die durch multimodale Eingaben wie Text, Körperhaltung, Skizzen und Stofftexturen gesteuert werden.