Der Artikel präsentiert einen neuartigen Ansatz namens Dual-SAM zur hochleistungsfähigen Segmentierung von Meerestieren.
Zunächst wird eine duale Struktur eingeführt, um die Merkmalsextraktion von Meeresbildern zu verbessern. Dazu wird eine Gamma-Korrektur-Operation verwendet, um die Beleuchtungsmerkmale der Meeresbilder zu kompensieren. Außerdem werden Adapter in den SAM-Encoder integriert, um domänenspezifische Informationen zu extrahieren.
Dann wird eine Multi-Level-gekoppelte Eingabeaufforderung (MCP) vorgeschlagen, um umfassende Vorabinformationen über Unterwasserszenarien zu vermitteln. MCP verwendet einen selbst-aufmerksamkeitsmechanismus, um die Merkmale aus SAM zu verstärken, und einen Kreuz-Aufmerksamkeitsmechanismus, um die Merkmale zu integrieren.
Anschließend wird eine Dilated Fusion Attention Module (DFAM) entwickelt, um die mehrstufigen Merkmale aus dem SAM-Encoder schrittweise zu integrieren. DFAM verwendet dilatierte Konvolutionen und Kanalaufmerksamkeit, um sowohl semantische als auch detaillierte Informationen zu aggregieren.
Schließlich wird eine Criss-Cross Connectivity Prediction (C3P) vorgeschlagen, um die Konnektivität zwischen diskreten Pixeln zu erfassen. C3P erzeugt Pseudomasken und erreicht eine gegenseitige Überwachung für komplementäre Merkmalsdarstellungen, was zu erheblichen Verbesserungen gegenüber früheren Techniken führt.
Umfangreiche Experimente auf fünf weit verbreiteten Meerestier-Segmentierungsdatensätzen zeigen, dass der vorgeschlagene Ansatz den aktuellen Stand der Technik übertrifft.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Pingping Zha... om arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04996.pdfDiepere vragen