Effiziente Verarbeitung und Analyse von Inhalten durch strukturierte Diffusion mit White-Box-Transformatoren
Eine weiße-Box-Transformator-Architektur, genannt CRATE-MAE, die eine fundamentale Verbindung zwischen Diffusion, Kompression und (maskierter) Vervollständigung nutzt, um große-Skala-Repräsentationslernung durchzuführen.