Die Studie stellt das VM-UNetV2-Modell vor, das auf State-Space-Modellen (SSM) wie Mamba basiert, um die medizinische Bildsegmentierung zu verbessern.
Der Encoder des Modells verwendet VSS-Blöcke, um lange Abhängigkeiten in den Bildern zu erfassen. Der SDI-Modul kombiniert semantische und detaillierte Informationen, um die Segmentierungsleistung zu steigern.
Die Autoren führen umfangreiche Experimente auf Datensätzen für Hautkrankheiten und Polypen durch. Die Ergebnisse zeigen, dass VM-UNetV2 im Vergleich zu anderen Modellen wettbewerbsfähige Leistungen erbringt. Darüber hinaus ist das Modell auch in Bezug auf Rechenaufwand (FLOPs, Parameter, FPS) effizient.
Die Studie untersucht auch den Einfluss der Encodertiefe und des Deep-Supervision-Mechanismus auf die Segmentierungsleistung. Die Ergebnisse zeigen, dass eine moderate Encodertiefe und der Einsatz von Deep Supervision in den meisten Fällen vorteilhaft sind.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Mingya Zhang... alle arxiv.org 03-15-2024
https://arxiv.org/pdf/2403.09157.pdfDomande più approfondite