Core Concepts
Ein neuartiges Verfahren zur robusten Übertragung von Merkmalen von einem leistungsfähigen Lehrermodell auf ein leichtes Schülermodell wird entwickelt, um die Genauigkeit und Robustheit des Schülermodells für die praktische Anwendung zu verbessern.
Abstract
Der Artikel stellt ein neues Verfahren namens "Robust Feature Knowledge Distillation" (RFKD) vor, um die Leistung leichter Risserkennungsmodelle zu verbessern.
Zunächst wird erläutert, dass bisherige Wissensübertragungsverfahren (Knowledge Distillation, KD) zwar die Genauigkeit leichter Modelle steigern können, aber deren Robustheit gegenüber Bildstörungen nicht verbessern. Das vorgeschlagene RFKD-Verfahren überträgt zusätzlich zu den Logit-Schichten auch Merkmale aus den Zwischenschichten des Lehrermodells auf den Schüler. Außerdem wird der Schüler mit einer Mischung aus sauberen und verrauschten Bildern trainiert, um robuste Merkmale zu lernen.
Um die Leistungsfähigkeit des RFKD-Verfahrens zu demonstrieren, wird ein neuartiges, leichtes Transformermodell namens "PoolingCrackTiny" (PCT) mit nur 0,5 Millionen Parametern entwickelt und mit RFKD trainiert. Die Ergebnisse zeigen, dass das RFKD-trainierte PCT-Modell eine um bis zu 62% höhere mittlere Dice-Punktzahl (mDS) gegenüber Rauschen aufweist als Vergleichsmodelle. Außerdem ist das PCT-Modell deutlich leichter als andere leichte Modelle, bei vergleichbarer Genauigkeit auf sauberen Daten.
Insgesamt zeigt der Artikel, dass das RFKD-Verfahren eine effektive Möglichkeit bietet, leichte und robuste Risserkennungsmodelle für den praktischen Einsatz zu entwickeln.
Stats
Das RFKD-trainierte PCT-Modell erreicht eine um bis zu 62% höhere mittlere Dice-Punktzahl (mDS) gegenüber Rauschen als Vergleichsmodelle.
Das PCT-Modell hat 74% - 92% weniger Parameter, 4% - 75% weniger FLOPs und 16% - 74% kürzere Inferenzzeit als andere leichte Modelle.
Quotes
"Robuste Merkmalsübertragung zur Leistungssteigerung leichter Risserkennungsmodelle"
"Ein neuartiges Verfahren zur robusten Übertragung von Merkmalen von einem leistungsfähigen Lehrermodell auf ein leichtes Schülermodell wird entwickelt, um die Genauigkeit und Robustheit des Schülermodells für die praktische Anwendung zu verbessern."