Effiziente und leistungsfähige Diffusions-Transformer-Architektur durch selbstüberwachte Diskriminierung
Die Kernaussage dieses Artikels ist, dass die Autoren eine neuartige Diffusions-Transformer-Architektur (SD-DiT) entwickelt haben, die die Leistungsfähigkeit und Effizienz des Trainings durch den Einsatz von selbstüberwachter Diskriminierung deutlich verbessert.