Durch die Optimierung des Anfangsrauschens können Text-zu-Bild-Diffusionsmodelle präzisere Bilder generieren, die besser mit den Textbeschreibungen übereinstimmen.