Die Studie befasst sich mit der Verbesserung der schwach überwachten semantischen Segmentierung (WSSS), bei der nur Bildebenen-Etiketten zur Verfügung stehen. Die Autoren identifizieren ein wichtiges, aber bisher übersehenes Problem der Bestätigungsverzerrung von Klassen-Aktivierungskarten (CAM) in einsträngigen WSSS-Methoden. Dieses Problem führt dazu, dass die CAM-Pseudomarkierungen die Segmentierungsleistung beeinträchtigen.
Um dies zu lösen, schlagen die Autoren eine duale Studentenarchitektur vor, bei der zwei unabhängige Teilnetze gegenseitig voneinander lernen und so die Bestätigungsverzerrung abmildern. Darüber hinaus entwickeln sie ein vertrauenswürdiges progressives Lernverfahren, das mehr zuverlässige Pseudomarkierungen in die Segmentierungssupervision einbezieht und gleichzeitig die Rauschartefakte in den Pseudomarkierungen reduziert. Für die als unzuverlässig eingestuften Regionen wird eine Konsistenzregularisierung eingeführt, um die Segmentierung in diesen Bereichen zu verbessern.
Die Experimente auf den PASCAL VOC 2012 und MS COCO 2014 Datensätzen zeigen, dass der vorgeschlagene Ansatz die Leistung der einsträngigen WSSS-Methoden deutlich übertrifft und mit den mehrstufigen Lösungen vergleichbare Ergebnisse erzielt.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Yuanchen Wu,... ב- arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11184.pdfשאלות מעמיקות