Der Latenzoptimierte Bildverarbeitungstransformer (LIPT) erzielt eine praktische Beschleunigung der Bildrekonstruktion bei gleichzeitig hoher Qualität, indem er speicherintensive Operationen durch eine Kombination aus Selbstaufmerksamkeit und Faltungen ersetzt.
Das vorgeschlagene IPT-V2-Architektur mit hierarchischen Aufmerksamkeiten kann sowohl lokale als auch globale Tokeninteraktionen explizit und effizient modellieren, um die Details und den verlorenen Inhalt von degradierten Bildern wiederherzustellen.