核心概念
Remote Sensing Mamba (RSM) ist ein effizientes Modell, das globale Merkmale von Fernerkundungsbildern mit sehr hoher Auflösung mit linearer Komplexität erfassen kann, um Aufgaben der dichten Vorhersage wie semantische Segmentierung und Änderungserkennung effektiv durchzuführen.
摘要
Der Beitrag stellt Remote Sensing Mamba (RSM) vor, ein Modell für Aufgaben der dichten Vorhersage in Fernerkundungsbildern mit sehr hoher Auflösung (VHR). VHR-Fernerkundungsbilder zeichnen sich durch große räumliche Merkmale in mehreren Richtungen aus, was eine Herausforderung für bestehende Modelle darstellt.
RSM nutzt State Space Models (SSM), um globale Merkmale mit linearer Komplexität zu erfassen, ohne die Bilder in kleinere Patches unterteilen zu müssen. Dafür wurde eine Omnidirektionale Selektive Scan-Modul (OSSM) entwickelt, das Merkmale in horizontaler, vertikaler, diagonaler und anti-diagonaler Richtung extrahiert.
Experimente zur semantischen Segmentierung und Änderungserkennung zeigen, dass RSM den Stand der Technik übertrifft, obwohl es eine einfache Architektur verwendet. Dies unterstreicht das Potenzial von SSM-basierten Ansätzen für dichte Vorhersageaufgaben in VHR-Fernerkundung.
統計資料
Die räumliche Auflösung von Fernerkundungsbildern nimmt ständig zu, was Herausforderungen bei der Verarbeitung großer VHR-Bilder für Aufgaben der dichten Vorhersage mit sich bringt.
Konvolutionale neuronale Netze sind aufgrund ihrer lokalen Konvolutionsoperationen in ihrer Fähigkeit eingeschränkt, globale Merkmale von Fernerkundungsbildern zu modellieren.
Transformer-basierte Modelle stehen aufgrund ihrer quadratischen Komplexität vor Herausforderungen bei der Verarbeitung großer VHR-Bilder.
引述
"RSM ist darauf ausgelegt, globale Merkmale von Fernerkundungsbildern mit linearer Komplexität zu modellieren, was es ihm ermöglicht, große VHR-Bilder effektiv zu verarbeiten."
"Das vorgeschlagene Omnidirektionale Selektive Scan-Modul (OSSM) verbessert das globale effektive Rezeptionsfeld in mehreren Richtungen, wodurch umfassende globale räumliche Merkmale extrahiert werden können."