Der Artikel stellt eine neue Methode namens FusionMamba vor, die für effiziente Bildfusion entwickelt wurde. Anstatt herkömmliche Convolutional Neural Networks (CNNs) oder Transformer-Modelle zu verwenden, integriert FusionMamba Mamba-Blöcke, eine Weiterentwicklung des Zustandsraummodells (State Space Model, SSM), in eine neuartige netzwerkarchitektur.
Zunächst werden zwei U-förmige Netzwerke verwendet - ein räumliches U-Net und ein spektrales U-Net. Das räumliche U-Net extrahiert räumliche Merkmale aus dem Eingangsbild, während das spektrale U-Net spektrale Eigenschaften aus dem niederauflösenden Bild mit reichen Spektralinformationen erfasst. Durch diese unabhängige und hierarchische Merkmalsextraktion können die unterschiedlichen Eigenschaften der Eingabebilder effizient gelernt werden.
Um die räumlichen und spektralen Informationen effektiv zu kombinieren, erweitert FusionMamba den Mamba-Block, um Dual-Input-Verarbeitung zu ermöglichen. Dieser neue FusionMamba-Block übertrifft bestehende Fusionsmethoden wie Verkettung und Kreuzaufmerksamkeit.
Die Experimente auf fünf Datensätzen zu drei Bildfusionsaufgaben zeigen, dass FusionMamba den aktuellen Stand der Technik übertrifft und gleichzeitig einen vertretbaren Rechenaufwand aufweist.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Siran Peng,X... alle arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07932.pdfDomande più approfondite