Kernkonzepte
Ein einfacher und effektiver Rahmen für die visuelle Mehrklassifikation, der kontrastives Lernen mit Gaußschen Mischverteilungen kombiniert, um Labelabhängigkeiten zu erfassen und die Unsicherheit des Encoders zu untersuchen.
Zusammenfassung
Die Studie präsentiert einen neuen Rahmen namens "Probabilistic Multi-label Contrastive Learning (ProbMCL)" für die visuelle Mehrklassifikation. Der Ansatz kombiniert kontrastives Lernen mit Gaußschen Mischverteilungen, um Labelabhängigkeiten zu erfassen und die Unsicherheit des Encoders zu untersuchen.
Kernpunkte:
- ProbMCL verwendet kontrastives Lernen, um positive Beispiele basierend auf einem Überlappungsindex zwischen Labelvektoren zu definieren. Dies ermöglicht es, Labelabhängigkeiten ohne schwere Korrelationsmodule zu erfassen.
- Ein Mischverteilungsnetzwerk (MDN) wird in den Lernprozess integriert, um Gaußsche Mischverteilungen der Merkmalsrepräsentationen zu erzeugen und die Unsicherheit des Encoders zu schätzen.
- Experimente auf Computervisions- und medizinischen Bildgebungsdatensätzen zeigen, dass ProbMCL die Leistung bestehender Methoden übertrifft, während es einen geringeren Rechenaufwand aufweist.
- Visualisierungsanalysen demonstrieren, dass die von ProbMCL erlernten Klassifikatoren eine sinnvolle semantische Topologie beibehalten.
Statistiken
ProbMCL erreicht einen mAP-Wert von 89,1% auf dem MS-COCO-Datensatz, was eine Verbesserung von 0,7% gegenüber dem besten Vergleichsverfahren darstellt.
Auf dem ADP-Datensatz erzielt ProbMCL einen mAP-Wert von 96,9%, was eine Steigerung der Recall-Leistung bei gleichzeitig wettbewerbsfähiger Präzision bedeutet.
ProbMCL weist im Vergleich zu vorherigen Ansätzen einen geringeren Rechenaufwand auf, mit 42,23 Millionen Parametern und 29,65 GMAC.
Zitate
"ProbMCL, ein einfacher und effektiver Rahmen für die visuelle Mehrklassifikation, der kontrastives Lernen mit Gaußschen Mischverteilungen kombiniert, um Labelabhängigkeiten zu erfassen und die Unsicherheit des Encoders zu untersuchen."
"Experimente auf Computervisions- und medizinischen Bildgebungsdatensätzen zeigen, dass ProbMCL die Leistung bestehender Methoden übertrifft, während es einen geringeren Rechenaufwand aufweist."