Concepts de base
Wir stellen ein Polyp-Segmentierungsmodell vor, das auf der Prompt-Mamba-Technologie basiert und eine hervorragende Generalisierungsfähigkeit auf unbekannten Datensätzen aufweist, indem es die Stärken von Vision-Mamba und Prompt-Technologie kombiniert.
Résumé
In dieser Arbeit präsentieren wir ein Polyp-Segmentierungsmodell, das auf der Prompt-Mamba-Technologie basiert. Das Modell besteht aus drei Hauptkomponenten: einem bildverarbeitenden Image-Encoder, einem Prompt-Encoder und einem Mask-Decoder.
Der Image-Encoder verwendet die Vision-Mamba-Architektur, die sich durch eine effiziente Merkmalsextraktion auszeichnet. Der Prompt-Encoder nutzt Box-Prompts, um die Generalisierungsfähigkeit des Modells zu verbessern. Der Mask-Decoder kombiniert die Ausgaben des Image-Encoders und des Prompt-Encoders, um die endgültige Segmentierungsmaske zu erzeugen.
Im Vergleich zu früheren Methoden zeigt unser Modell nicht nur eine hohe Segmentierungsgenauigkeit auf den Validierungsdatensätzen, sondern übertrifft auch den Stand der Technik um durchschnittlich 5% auf sechs verschiedenen Datensätzen. Darüber hinaus haben wir mehrere skalierbare Versionen unseres Modells entwickelt, die selbst mit weniger Parametern eine bessere Leistung als frühere Modelle erzielen.
Unsere Hauptbeiträge sind:
- Wir sind die Ersten, die die Vision-Mamba-Technologie auf die Polyp-Segmentierung anwenden.
- Wir schlagen eine effiziente Modellstruktur vor, die Prompt-Technologie integriert und so eine hervorragende Generalisierungsfähigkeit erreicht.
- Wir skalieren unser Modell auf verschiedene Weise und erzielen auch mit weniger Parametern gute Ergebnisse im Vergleich zu früheren Methoden.
Stats
Polypen weisen eine große Vielfalt an Formen und Farben auf, was die Segmentierung erschwert.
Die Grenzen zwischen Polypen und normalem Gewebe sind oft unscharf, was ebenfalls die Segmentierung erschwert.
Unterschiede zwischen Datensätzen führen zu begrenzten Generalisierungsfähigkeiten bestehender Methoden.
Citations
"Polyp-Segmentierung ist eine herausfordernde Aufgabe in der medizinischen Bildverarbeitung, bei der die genaue Extraktion und Trennung von Polyp-Regionen aus medizinischen Bildern erfolgt."
"Die Einführung des U-Net-Modells hat seine hervorragende Leistung bei medizinischen Bildsegmentierungsaufgaben, einschließlich der Polyp-Segmentierung, gezeigt und die Segmentierungsgenauigkeit deutlich verbessert."