Core Concepts
Eine neue Methode zum Bestimmen von Mehrfachlabels, die die Annotationskosten deutlich reduziert, indem für jede Trainingsinstanz nur ein zufällig ausgewähltes Label als "vorhanden" oder "nicht vorhanden" gekennzeichnet werden muss.
Abstract
Die Autoren stellen eine neue Methode zum Bestimmen von Mehrfachlabels vor, die die Annotationskosten deutlich reduziert. In diesem neuen Ansatz wird für jede Trainingsinstanz nur ein zufällig ausgewähltes Label als "vorhanden" oder "nicht vorhanden" gekennzeichnet, anstatt alle relevanten Labels präzise zu annotieren.
Zunächst leiten die Autoren einen risikokonformen Schätzer her, der auf diesen "bestimmten" Mehrfachlabels basiert. Zusätzlich führen sie eine neuartige ähnlichkeitsbasierte Prompt-Lernmethode ein, die die semantische Information der Klassenlabels durch Minimierung des risikokonformen Verlusts erweitert.
Umfangreiche experimentelle Validierungen zeigen, dass der vorgeschlagene Ansatz die Leistung im Vergleich zu bestehenden Methoden für schwach überwachtes Mehrfachlabel-Lernen deutlich verbessert.
Stats
Die Trainingsinstanzen sind mit einem zufällig ausgewählten Label als "vorhanden" (1) oder "nicht vorhanden" (0) gekennzeichnet.
Die Anzahl der positiven Trainingsinstanzen (y_gamma=1) ist deutlich geringer als die Anzahl der negativen Instanzen (y_gamma=0).
Quotes
"In diesem neuen Ansatz wird für jede Trainingsinstanz nur ein zufällig ausgewähltes Label als 'vorhanden' oder 'nicht vorhanden' gekennzeichnet, anstatt alle relevanten Labels präzise zu annotieren."
"Eine neuartige ähnlichkeitsbasierte Prompt-Lernmethode erweitert die semantische Information der Klassenlabels durch Minimierung des risikokonformen Verlusts."