Die Skalierung von Modellgröße und Datenmenge ist der Schlüsselfaktor für den Erfolg von Sprach- und Bildmodellen. Die Skalierungseigenschaften von diffusionsbasierten Text-zu-Bild-Modellen sind jedoch nicht gut erforscht. Diese Studie untersucht systematisch die Auswirkungen des Skalierens sowohl des Entschärfungsrückgrats als auch des Datensatzes auf die Leistung und Effizienz von Text-zu-Bild-Modellen.


coremsg

effiziente-skalierung-von-diffusionsbasierten-text-zu-bild-generierungsmodellen


Effiziente Skalierung von diffusionsbasierten Text-zu-Bild-Generierungsmodellen