In dieser Arbeit stellen wir ein Polyp-Segmentierungsmodell vor, das auf Prompt-Mamba basiert. Das Modell besteht aus drei Teilen: Image-Encoder, Prompt-Encoder und Mask-Decoder. Der Image-Encoder verwendet die Vision-Mamba-Architektur, die eine effiziente Merkmalsextraktion ermöglicht. Der Prompt-Encoder nutzt Box-Prompt-Technologie, um die Generalisierungsfähigkeit des Modells zu verbessern. Der Mask-Decoder ist leicht gehalten und kombiniert die Ausgaben des Image-Encoders und des Prompt-Encoders, um die endgültige Segmentierungsmaske zu erzeugen.
Im Vergleich zu früheren Methoden, die auf denselben Datensätzen trainiert wurden, behält unser Modell nicht nur eine hohe Segmentierungsgenauigkeit auf dem Validierungsteil desselben Datensatzes, sondern zeigt auch eine überlegene Genauigkeit auf ungesehenen Datensätzen, was auf hervorragende Generalisierungsfähigkeiten hinweist. Wir sind die Ersten, die die Vision-Mamba-Architektur auf die Polyp-Segmentierung anwenden, und die Ersten, die Prompt-Technologie in einem Polyp-Segmentierungsmodell einsetzen.
Unsere Experimente zeigen, dass unser Modell die vorherigen State-of-the-Art-Methoden im Durchschnitt um 5% übertrifft. Darüber hinaus haben wir mehrere Versionen unseres Modells mit unterschiedlichen Parameteranzahlen entwickelt und erreichen selbst mit weniger Parametern bessere Leistung als frühere Modelle.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Jianhao Xie,... pada arxiv.org 03-21-2024
https://arxiv.org/pdf/2403.13660.pdfPertanyaan yang Lebih Dalam