المفاهيم الأساسية
Ein-Klassen-Klassifikatoren können so trainiert werden, dass sie den Likelihood-Test implementieren, wenn nur Daten der positiven Klasse verfügbar sind.
الملخص
Der Artikel befasst sich mit dem Problem der Entscheidungsfindung zwischen zwei Alternativen (Hypothesen) basierend auf einer Beobachtung, wenn nur die Wahrscheinlichkeitsdichtefunktion (PDF) der Beobachtungen unter einer der beiden Alternativen bekannt ist.
Es werden zwei Ansätze untersucht:
Der statistische Ansatz verwendet den Likelihood-Test (LT), wenn die PDF der positiven Klasse bekannt ist.
Der maschinelle Lernansatz verwendet Ein-Klassen-Klassifikatoren (OCC), wenn nur Daten der positiven Klasse verfügbar sind.
Der Artikel zeigt, dass bestimmte OCC-Modelle, wie neuronale Netze und least-squares Support-Vektor-Maschinen, so trainiert werden können, dass sie den LT implementieren, wenn ein künstlicher Datensatz für die negative Klasse verwendet wird. Außerdem wird ein modifizierter stochastischer Gradientenabstiegsalgorithmus vorgestellt, der dies ohne künstlichen Datensatz erreicht. Es wird bewiesen, dass der weit verbreitete Autoencoder-Klassifikator im Allgemeinen nicht den LT liefert.
الإحصائيات
Die Wahrscheinlichkeit eines Fehlalarms ist gegeben durch:
PFA(f) = ∫a:f(a)=H1 p0(a)da
Die Wahrscheinlichkeit eines Nichterkennungsfehlers ist gegeben durch:
PMD(f) = ∫a:f(a)=H0 p1(a)da
اقتباسات
"Ohne Kenntnis einer PDF ist das resultierende Entscheidungsproblem als Null-Hypothesen-Testproblem bekannt. Im maschinellen Lernansatz ohne einen Datensatz aus einer Klasse haben wir das Problem der Ein-Klassen-Klassifikation (OCC)."
"Wir zielen darauf ab, OCC-Methoden zu erhalten, die als Null-Hypothesen-Testmethoden arbeiten. Insbesondere zielen wir darauf ab, das Verhalten des LT mit OCC-Modellen nachzubilden."