Core Concepts
Durch die Verwendung eines neuartigen kontrastiven Lernziels, das implizite und explizite Supervision aus positiven und ungelabelten Daten nutzt, können leistungsfähigere Repräsentationen für die Positiv-Ungelabelte Klassifikation gelernt werden.
Abstract
In diesem Artikel wird ein neuer Ansatz für das kontrastive Lernen von Repräsentationen in der Positiv-Ungelabelten (PU) Lernaufgabe vorgestellt. Die Hauptidee ist es, jede Trainingsbeobachtung individuell zu gewichten, indem die gelabelten positiven Beispiele Gewicht 1 erhalten und die ungelabelten Beispiele dupliziert werden - eine Kopie wird als positiv mit Gewicht π und eine als negativ mit Gewicht (1-π) markiert, wobei π der Klassenanteil ist. Dieses Vorgehen, genannt puNCE, ermöglicht es, die verfügbare schwache Supervision aus den ungelabelten Daten effizient zu nutzen.
Die Experimente zeigen, dass puNCE im Vergleich zu bestehenden unüberwachten und überwachten kontrastiven Ansätzen konsistent bessere Repräsentationen lernt, insbesondere wenn nur wenig Supervision verfügbar ist. Auf PU-Klassifikationsaufgaben führt der Einsatz von puNCE für das kontrastive Vortraining gefolgt von überwachtem Finetuning zu erheblichen Verbesserungen gegenüber dem Stand der Technik.
Darüber hinaus zeigt sich, dass puNCE auch im allgemeinen binären semi-überwachten Lernkontext (PNU-Lernen) Vorteile bringt und sogar bei wenigen Beispielen zu besseren Ergebnissen führt als bestehende Ansätze.
Stats
Die Klasse ist a priori mit Wahrscheinlichkeit π verteilt.
Die gelabelten positiven Beispiele haben Gewicht 1.
Die ungelabelten Beispiele werden als positiv mit Gewicht π und negativ mit Gewicht (1-π) behandelt.
Quotes
"Durch die Verwendung eines neuartigen kontrastiven Lernziels, das implizite und explizite Supervision aus positiven und ungelabelten Daten nutzt, können leistungsfähigere Repräsentationen für die Positiv-Ungelabelte Klassifikation gelernt werden."
"puNCE behandelt jedes ungelabelte Beispiel als positiv mit Wahrscheinlichkeit π und als negativ mit Wahrscheinlichkeit (1-π)."