核心概念
Das vorgeschlagene RS3Mamba-Modell nutzt einen innovativen visuellen Zustandsraum (VSS), um zusätzliche globale Informationen bereitzustellen und die Leistung der konventionellen CNN-basierten Methoden bei der semantischen Segmentierung von Fernerkundungsbildern zu verbessern.
要約
Die Studie präsentiert ein neuartiges duales Netzwerk namens RS3Mamba, das die VSS-Technologie in Fernerkundungsaufgaben integriert. Das Modell verwendet VSS-Blöcke, um einen Hilfszweig aufzubauen, der dem konventionellen CNN-basierten Hauptzweig zusätzliche globale Informationen liefert. Darüber hinaus führt das Modell einen kollaborativen Vervollständigungsmodul (CCM) ein, um die Merkmale der beiden Zweige effektiv zu verschmelzen.
Die Experimente auf zwei weit verbreiteten Fernerkundungsdatensätzen, ISPRS Vaihingen und LoveDA Urban, zeigen, dass RS3Mamba die Leistung bestehender CNN- und Transformer-basierter Methoden übertrifft. Dies ist der erste Versuch, Mamba-Modelle speziell für die semantische Segmentierung von Fernerkundungsbildern zu entwickeln und bietet wertvolle Erkenntnisse für die zukünftige Entwicklung effizienterer und effektiverer VSS-basierter Methoden für Fernerkundungsaufgaben.
統計
Das vorgeschlagene RS3Mamba-Modell erzielt auf dem ISPRS-Vaihingen-Datensatz einen mittleren F1-Wert von 90,34% und einen mittleren IoU-Wert von 82,78%, was einer Steigerung von 0,49% bzw. 0,81% gegenüber dem Basismodell UNetformer entspricht.
Auf dem LoveDA Urban-Datensatz verbessert RS3Mamba den mittleren F1-Wert um 1,52% und den mittleren IoU-Wert um 1,81% im Vergleich zu den besten bestehenden Methoden.
引用
"Das vorgeschlagene RS3Mamba-Modell bietet wertvolle Erkenntnisse für die zukünftige Entwicklung effizienterer und effektiverer VSS-basierter Methoden für Fernerkundungsaufgaben."
"Die Experimente auf zwei weit verbreiteten Fernerkundungsdatensätzen zeigen, dass RS3Mamba die Leistung bestehender CNN- und Transformer-basierter Methoden übertrifft."