Effiziente Skalierung von diffusionsbasierten Text-zu-Bild-Generierungsmodellen
Die Skalierung von Modellgröße und Datenmenge ist der Schlüsselfaktor für den Erfolg von Sprach- und Bildmodellen. Die Skalierungseigenschaften von diffusionsbasierten Text-zu-Bild-Modellen sind jedoch nicht gut erforscht. Diese Studie untersucht systematisch die Auswirkungen des Skalierens sowohl des Entschärfungsrückgrats als auch des Datensatzes auf die Leistung und Effizienz von Text-zu-Bild-Modellen.