Effizientes Training von Diffusionsmodellen mit maskierten Transformern zur Verbesserung der Generationsleistung.