Die Studie stellt das VM-UNetV2-Modell vor, das auf State-Space-Modellen (SSM) wie Mamba basiert, um die medizinische Bildsegmentierung zu verbessern.
Der Encoder des Modells verwendet VSS-Blöcke, um lange Abhängigkeiten in den Bildern zu erfassen. Der SDI-Modul kombiniert semantische und detaillierte Informationen, um die Segmentierungsleistung zu steigern.
Die Autoren führen umfangreiche Experimente auf Datensätzen für Hautkrankheiten und Polypen durch. Die Ergebnisse zeigen, dass VM-UNetV2 im Vergleich zu anderen Modellen wettbewerbsfähige Leistungen erbringt. Darüber hinaus ist das Modell auch in Bezug auf Rechenaufwand (FLOPs, Parameter, FPS) effizient.
Die Studie untersucht auch den Einfluss der Encodertiefe und des Deep-Supervision-Mechanismus auf die Segmentierungsleistung. Die Ergebnisse zeigen, dass eine moderate Encodertiefe und der Einsatz von Deep Supervision in den meisten Fällen vorteilhaft sind.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Mingya Zhang... pada arxiv.org 03-15-2024
https://arxiv.org/pdf/2403.09157.pdfPertanyaan yang Lebih Dalam