Core Concepts
Ein neuer Ansatz zur Ausnutzung klassenübergreifender positiver Beziehungen in teilweise beschrifteten Daten, um die Darstellung für eine bessere Kategorieentdeckung zu stärken.
Abstract
Die Studie befasst sich mit dem Problem der verallgemeinerten Kategorieentdeckung (GCD), bei dem ein teilweise beschrifteter Datensatz automatisch geclustert werden soll, wobei die unbeschrifteten Daten sowohl von bekannten als auch von neuen Kategorien stammen können.
Der Hauptbeitrag ist ein neuer Ansatz namens CiPR, der die Darstellung durch die Ausnutzung klassenübergreifender positiver Beziehungen in den teilweise beschrifteten Daten für kontrastives Lernen verbessert. Dazu wird ein semi-überwachter hierarchischer Clustering-Algorithmus namens SNC eingeführt, der zuverlässige Pseudobeschriftungen erzeugt, um die Verbindungen zwischen beschrifteten und unbeschrifteten Instanzen zu stärken.
SNC kann nicht nur zuverlässige Pseudobeschriftungen für die Repräsentationslernung erzeugen, sondern auch die unbekannte Klassenzahl schätzen, ohne dass mehrfache Durchläufe des Clustering-Algorithmus erforderlich sind. CiPR übertrifft den aktuellen Stand der Technik auf generischen Bilderkennungsdatensätzen und anspruchsvollen feingranularen Datensätzen deutlich.
Stats
Die Zahl der unbekannten Klassen beträgt für CIFAR-10: 10, für CIFAR-100: 100, für ImageNet-100: 100, für CUB-200: 200, für SCars: 196 und für Herbarium19: 683.
Quotes
Keine relevanten Zitate gefunden.