핵심 개념
FusionMamba, eine innovative Methode, ermöglicht eine effiziente Fusion von Bildern durch die Verwendung eines Zustandsraummodells, das sowohl globale als auch lokale Informationen effektiv integriert.
초록
Der Artikel stellt eine neue Methode namens FusionMamba vor, die für effiziente Bildfusion entwickelt wurde. Anstatt herkömmliche Convolutional Neural Networks (CNNs) oder Transformer-Modelle zu verwenden, integriert FusionMamba Mamba-Blöcke, eine Weiterentwicklung des Zustandsraummodells (State Space Model, SSM), in eine neuartige netzwerkarchitektur.
Zunächst werden zwei U-förmige Netzwerke verwendet - ein räumliches U-Net und ein spektrales U-Net. Das räumliche U-Net extrahiert räumliche Merkmale aus dem Eingangsbild, während das spektrale U-Net spektrale Eigenschaften aus dem niederauflösenden Bild mit reichen Spektralinformationen erfasst. Durch diese unabhängige und hierarchische Merkmalsextraktion können die unterschiedlichen Eigenschaften der Eingabebilder effizient gelernt werden.
Um die räumlichen und spektralen Informationen effektiv zu kombinieren, erweitert FusionMamba den Mamba-Block, um Dual-Input-Verarbeitung zu ermöglichen. Dieser neue FusionMamba-Block übertrifft bestehende Fusionsmethoden wie Verkettung und Kreuzaufmerksamkeit.
Die Experimente auf fünf Datensätzen zu drei Bildfusionsaufgaben zeigen, dass FusionMamba den aktuellen Stand der Technik übertrifft und gleichzeitig einen vertretbaren Rechenaufwand aufweist.
통계
Die Methode erzielt auf dem WV3-Datensatz einen PSNR-Wert von 39,283 ± 2,986, einen Q8-Wert von 0,921 ± 0,085, einen SAM-Wert von 2,848 ± 0,571 und einen ERGAS-Wert von 2,107 ± 0,507.
Auf dem Pavia-Datensatz erreicht die Methode einen PSNR-Wert von 35,610, einen CC-Wert von 0,973, einen SSIM-Wert von 0,871, einen SAM-Wert von 3,979 und einen ERGAS-Wert von 3,164.
Auf dem Botswana-Datensatz erzielt die Methode einen PSNR-Wert von 33,945, einen CC-Wert von 0,966, einen SSIM-Wert von 0,880, einen SAM-Wert von 1,278 und einen ERGAS-Wert von 1,079.
Auf dem WDC-Datensatz erreicht die Methode einen PSNR-Wert von 31,003, einen CC-Wert von 0,965, einen SSIM-Wert von 0,881, einen SAM-Wert von 3,772 und einen ERGAS-Wert von 3,793.
인용구
"FusionMamba, eine innovative Methode, ermöglicht eine effiziente Fusion von Bildern durch die Verwendung eines Zustandsraummodells, das sowohl globale als auch lokale Informationen effektiv integriert."
"Durch diese unabhängige und hierarchische Merkmalsextraktion können die unterschiedlichen Eigenschaften der Eingabebilder effizient gelernt werden."
"Der neue FusionMamba-Block übertrifft bestehende Fusionsmethoden wie Verkettung und Kreuzaufmerksamkeit."