Der Artikel stellt eine neue Methode namens FusionMamba vor, die für effiziente Bildfusion entwickelt wurde. Anstatt herkömmliche Convolutional Neural Networks (CNNs) oder Transformer-Modelle zu verwenden, integriert FusionMamba Mamba-Blöcke, eine Weiterentwicklung des Zustandsraummodells (State Space Model, SSM), in eine neuartige netzwerkarchitektur.
Zunächst werden zwei U-förmige Netzwerke verwendet - ein räumliches U-Net und ein spektrales U-Net. Das räumliche U-Net extrahiert räumliche Merkmale aus dem Eingangsbild, während das spektrale U-Net spektrale Eigenschaften aus dem niederauflösenden Bild mit reichen Spektralinformationen erfasst. Durch diese unabhängige und hierarchische Merkmalsextraktion können die unterschiedlichen Eigenschaften der Eingabebilder effizient gelernt werden.
Um die räumlichen und spektralen Informationen effektiv zu kombinieren, erweitert FusionMamba den Mamba-Block, um Dual-Input-Verarbeitung zu ermöglichen. Dieser neue FusionMamba-Block übertrifft bestehende Fusionsmethoden wie Verkettung und Kreuzaufmerksamkeit.
Die Experimente auf fünf Datensätzen zu drei Bildfusionsaufgaben zeigen, dass FusionMamba den aktuellen Stand der Technik übertrifft und gleichzeitig einen vertretbaren Rechenaufwand aufweist.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Siran Peng,X... klo arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07932.pdfSyvällisempiä Kysymyksiä