Hochwertige Datensatz für kontrollierbare Text-zu-Bild-Generierung durch Mehrschichten-Bildannotationen
Einführung eines neuartigen Datensatzes namens MuLAn, der über 44.000 Mehrschichten-Annotationen von RGB-Bildern als mehrschichtige, instanzweise RGBA-Zerlegungen und über 100.000 Instanzbilder umfasst. Dieser Datensatz soll die Entwicklung von Technologien zur Generierung von Bildern als RGBA-Stapel fördern und neue Möglichkeiten für die kompositorische Text-zu-Bild-Forschung eröffnen.