Kernkonzepte
Ein neuer Rahmen namens MILLET, der Mehrfachinstanzlernen (MIL) für lokal erklärbare Zeitreihenklassifizierung nutzt, um die Interpretierbarkeit bestehender Deep-Learning-Zeitreihenklassifizierungsmodelle zu verbessern, ohne die Vorhersageleistung zu beeinträchtigen.
Zusammenfassung
In dieser Arbeit wird ein neuer Rahmen namens MILLET (Multiple Instance Learning for Locally Explainable Time series classification) vorgestellt, der Mehrfachinstanzlernen (MIL) nutzt, um die Interpretierbarkeit bestehender Deep-Learning-Zeitreihenklassifizierungsmodelle zu verbessern, ohne die Vorhersageleistung zu beeinträchtigen.
Der MILLET-Rahmen besteht aus drei Hauptanforderungen:
- Zeitreihen als MIL-Taschen behandeln: Jede Zeitreihe wird als eine Tasche von MIL-Instanzen (einzelne Zeitpunkte) betrachtet.
- Zeitpunktvorhersagen: Das Modell muss neben der Zeitreihenvorhersage auch Vorhersagen für einzelne Zeitpunkte liefern, um Interpretierbarkeit zu ermöglichen.
- Berücksichtigung der zeitlichen Reihenfolge: Da Zeitreihenklassifizierung ein sequentielles Lernproblem ist, muss die Reihenfolge der Zeitpunkte berücksichtigt werden.
Um diese Anforderungen zu erfüllen, werden vier verschiedene MIL-Pooling-Methoden vorgestellt, die in bestehende Deep-Learning-Zeitreihenklassifizierungsmodelle integriert werden können. Eine dieser Methoden, das vorgeschlagene Conjunctive Pooling, zeigt die beste Interpretierbarkeit und Vorhersageleistung.
Die Leistungsfähigkeit von MILLET wird auf 85 UCR-Zeitreihendatensätzen und einem neuen synthetischen Datensatz namens WebTraffic evaluiert. MILLET liefert nicht nur bessere Interpretierbarkeit als bekannte Methoden wie SHAP und CAM, sondern verbessert in den meisten Fällen auch die Vorhersagegenauigkeit.
Statistiken
Die Zeitreihen im WebTraffic-Datensatz haben eine Länge von 1008 Zeitpunkten.
Der WebTraffic-Datensatz enthält 500 Zeitreihen im Trainings- und 500 Zeitreihen im Testset.
Der WebTraffic-Datensatz hat 10 verschiedene Klassen, wobei die diskriminierenden Zeitpunkte für jede Klasse bekannt sind.
Zitate
"Konventionelle Zeitreihenklassifizierungsmethoden sind oft Black Boxes, die eine inhärente Interpretation ihrer Entscheidungsprozesse verschleiern."
"MIL ist gut geeignet, um diese Probleme zu überwinden, da es für schwach überwachte Kontexte entwickelt wurde, in einem End-to-End-Framework gelernt werden kann und in mehreren Domänen erfolgreich war."