Die Studie stellt SAMAug vor, eine neuartige Methode zur visuellen Punktprompt-Erweiterung für das Segment Anything Model (SAM). SAM ist ein leistungsfähiges Modell für die interaktive Bildsegmentierung, das Benutzerprompte in Form von Punkten, Begrenzungsboxen oder Masken verwendet. Allerdings kann ein einzelner Prompt zu Mehrdeutigkeiten führen, die das Modell nicht auflösen kann.
SAMAug generiert zusätzliche Punktprompts basierend auf der initialen Segmentierungsmaske von SAM, um die Intention des Benutzers besser zu verstehen. Vier verschiedene Strategien werden untersucht: Zufallsauswahl, Maximierung der Entropiedifferenz, Maximierung des Abstands und salienzbasierte Auswahl. Die Experimente auf COCO, Fundus, COVID QU-Ex und ISIC2018 Datensätzen zeigen, dass SAMAug die Segmentierungsleistung von SAM, insbesondere unter Verwendung der Distanz- und Salienz-basierten Methoden, verbessern kann.
SAMAug demonstriert das Potenzial der visuellen Prompt-Erweiterung für computergestützte Sehsysteme und stellt einen wichtigen Schritt in Richtung prompt-basierter Erweiterungsmethoden dar, die den Benutzeraufwand reduzieren und die Modellleistung verbessern können.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Haixing Dai,... a las arxiv.org 03-19-2024
https://arxiv.org/pdf/2307.01187.pdfConsultas más profundas