Core Concepts
Halbüberwachte prädiktive Clustering-Bäume und Ensemble-Lernverfahren können die Vorhersagegenauigkeit für Multi-Label-Klassifizierung und hierarchische Multi-Label-Klassifizierung im Vergleich zu überwachten Verfahren verbessern.
Abstract
Die Studie präsentiert halbüberwachte Methoden für die Multi-Label-Klassifizierung (MLC) und hierarchische Multi-Label-Klassifizierung (HMLC), die auf prädiktiven Clustering-Bäumen (PCTs) basieren. Die Methoden nutzen sowohl gekennzeichnete als auch ungelabelte Beispiele, um die Vorhersagegenauigkeit zu verbessern.
Kernpunkte:
Erweiterung des PCT-Lernverfahrens um eine halbüberwachte Variante, die sowohl Ziel- als auch Beschreibungsattribute bei der Spaltenevaluierung berücksichtigt.
Einführung eines Parameters, der den Grad der Überwachung in den Modellen kontrolliert.
Erweiterung der halbüberwachten PCTs zu Ensemble-Methoden (halbüberwachte Random Forests).
Umfangreiche experimentelle Evaluation auf 24 Datensätzen, die zeigt, dass die vorgeschlagenen halbüberwachten Methoden die Vorhersagegenauigkeit im Vergleich zu überwachten Methoden verbessern können.
Analyse, wie die Nutzung ungelabelter Daten die Ausnutzung von Zielabhängigkeiten in MLC und HMLC verbessern kann.
Stats
Die Verwendung ungelabelter Beispiele kann die Identifizierung von Zielabhängigkeiten in MLC und HMLC verbessern.
Ungelabelte Beispiele können Informationen über die Verteilung der Beschreibungsattribute liefern, die zur Verbesserung der Klassifikationsgenauigkeit genutzt werden können.
Quotes
"Halbüberwachtes Lernen (SSL) ist ein gängiger Ansatz zum Erlernen von Vorhersagemodellen unter Verwendung nicht nur gekennzeichneter, sondern auch ungelabelter Beispiele."
"Ungelabelte Beispiele können Informationen über die Verteilung der Beschreibungsattribute liefern, die zur Verbesserung der Klassifikationsgenauigkeit genutzt werden können."