Der Artikel präsentiert eine Deep-Unfolding-Methode mit Hybrid-Aufmerksamkeits-Transformer (HATNet) zur Verbesserung der Bildrekonstruktion in Einzelpixel-Bildgebungssystemen (SPI).
Zunächst wird das Tensor-ISTA-Unfolding-Framework eingeführt, das die Berechnung in zwei alternative Module unterteilt: einen effizienten Tensor-Gradientenabstieg und ein auf Hybrid-Aufmerksamkeits-Transformer basierendes Entfernungsmodul. Der Tensor-Gradientenabstieg nutzt die Kronecker-Struktur des SPI-Modells, um die Komplexität zu reduzieren. Das Entfernungsmodul verwendet eine Encoder-Decoder-Architektur mit räumlicher Dual-Skalen-Aufmerksamkeit und Kanal-Aufmerksamkeit, um hoch- und niederfrequente Informationen sowie globale Informationen effektiv zu aggregieren.
Umfangreiche Experimente auf synthetischen und realen Daten zeigen, dass HATNet den aktuellen Stand der Technik übertrifft, sowohl in Bezug auf die Bildqualität als auch auf die praktische Umsetzbarkeit in Großformat-SPI-Kameras. Die vorgeschlagene Methode ist ein wichtiger Schritt zur Verbesserung von Einzelpixel-Bildgebungssystemen für den Einsatz in der Praxis.
To Another Language
from source content
arxiv.org
Дополнительные вопросы