Das vorgeschlagene Netzwerk zur Bildsuper-Auflösung (ESTN) nutzt einen erweiterten Swin-Transformer mit alternierenden lokalen und globalen Merkmalsaggregationen, um eine umfassende räumliche und kanalbezogene Interaktion zu erreichen und so die nichtlineare Abbildungsleistung des Netzwerks zu verbessern.
Das vorgeschlagene Netzwerk zur Bildsuper-Auflösung (ESTN) verbessert die Leistung des Swin-Transformer-Modells durch eine alternative Aggregation lokaler und globaler Merkmale. Dadurch wird die nichtlineare Abbildungsfähigkeit des Netzwerks erhöht und eine flexiblere räumliche Langzeitabhängigkeit der Merkmale ermöglicht.
Unser Ansatz CasSR nutzt die Informationen im Eingabebild effizient, um hochwertige und detailreiche Bilder zu generieren, indem er ein Kaskaden-Diffusionsmodell und einen mehrfachen Aufmerksamkeitsmechanismus verwendet.