Die Studie stellt SAMAug vor, eine neuartige Methode zur visuellen Punktprompt-Erweiterung für das Segment Anything Model (SAM). SAM ist ein leistungsfähiges Modell für die interaktive Bildsegmentierung, das Benutzerprompte in Form von Punkten, Begrenzungsboxen oder Masken verwendet. Allerdings kann ein einzelner Prompt zu Mehrdeutigkeiten führen, die das Modell nicht auflösen kann.
SAMAug generiert zusätzliche Punktprompts basierend auf der initialen Segmentierungsmaske von SAM, um die Intention des Benutzers besser zu verstehen. Vier verschiedene Strategien werden untersucht: Zufallsauswahl, Maximierung der Entropiedifferenz, Maximierung des Abstands und salienzbasierte Auswahl. Die Experimente auf COCO, Fundus, COVID QU-Ex und ISIC2018 Datensätzen zeigen, dass SAMAug die Segmentierungsleistung von SAM, insbesondere unter Verwendung der Distanz- und Salienz-basierten Methoden, verbessern kann.
SAMAug demonstriert das Potenzial der visuellen Prompt-Erweiterung für computergestützte Sehsysteme und stellt einen wichtigen Schritt in Richtung prompt-basierter Erweiterungsmethoden dar, die den Benutzeraufwand reduzieren und die Modellleistung verbessern können.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Haixing Dai,... ที่ arxiv.org 03-19-2024
https://arxiv.org/pdf/2307.01187.pdfสอบถามเพิ่มเติม