Główne pojęcia
SAMAug ist eine neuartige Methode zur visuellen Punktprompt-Erweiterung, die die Leistung der interaktiven Bildsegmentierung des Segment Anything Model (SAM) verbessert, indem es zusätzliche Punktprompts generiert, um die Intention des Benutzers besser zu verstehen.
Streszczenie
Die Studie stellt SAMAug vor, eine neuartige Methode zur visuellen Punktprompt-Erweiterung für das Segment Anything Model (SAM). SAM ist ein leistungsfähiges Modell für die interaktive Bildsegmentierung, das Benutzerprompte in Form von Punkten, Begrenzungsboxen oder Masken verwendet. Allerdings kann ein einzelner Prompt zu Mehrdeutigkeiten führen, die das Modell nicht auflösen kann.
SAMAug generiert zusätzliche Punktprompts basierend auf der initialen Segmentierungsmaske von SAM, um die Intention des Benutzers besser zu verstehen. Vier verschiedene Strategien werden untersucht: Zufallsauswahl, Maximierung der Entropiedifferenz, Maximierung des Abstands und salienzbasierte Auswahl. Die Experimente auf COCO, Fundus, COVID QU-Ex und ISIC2018 Datensätzen zeigen, dass SAMAug die Segmentierungsleistung von SAM, insbesondere unter Verwendung der Distanz- und Salienz-basierten Methoden, verbessern kann.
SAMAug demonstriert das Potenzial der visuellen Prompt-Erweiterung für computergestützte Sehsysteme und stellt einen wichtigen Schritt in Richtung prompt-basierter Erweiterungsmethoden dar, die den Benutzeraufwand reduzieren und die Modellleistung verbessern können.
Statystyki
Die Verwendung von Punktprompten, die aus der Maximierung des Abstands oder der Salienz abgeleitet sind, kann die Segmentierungsleistung des Segment Anything Model (SAM) auf dem COCO-Datensatz um 0,05 Dice-Punkte verbessern.
Auf dem Fundus-Datensatz kann SAMAug die SAM-Leistung um 0,03-0,04 Dice-Punkte steigern, wobei die Distanz-basierte Methode am besten abschneidet.
Für den COVID QU-Ex-Datensatz verbessert SAMAug die Leistung von SAM um etwa 0,01 Dice-Punkte.
Auf dem ISIC2018-Datensatz übertrifft die Salienz-basierte Methode von SAMAug die Basisleistung von SAM um 0,02-0,07 Dice-Punkte.
Cytaty
"SAMAug demonstriert das Potenzial der visuellen Prompt-Erweiterung für computergestützte Sehsysteme und stellt einen wichtigen Schritt in Richtung prompt-basierter Erweiterungsmethoden dar, die den Benutzeraufwand reduzieren und die Modellleistung verbessern können."
"Die Verwendung von Punktprompten, die aus der Maximierung des Abstands oder der Salienz abgeleitet sind, kann die Segmentierungsleistung des Segment Anything Model (SAM) deutlich verbessern."