المفاهيم الأساسية
Eine Fusionsmethode, die globale Texturen und lokale Patch-basierte Informationen kombiniert, um die Leistung bei der feinkörnigen Bildklassifizierung zu verbessern.
الملخص
Die vorgeschlagene Methode "Deep Networks fused with Textures" (DNT) ist ein zweistufiges tiefes Modell, das auf zwei Wegen arbeitet:
- Der erste Weg extrahiert tiefe Merkmale aus verschiedenen festen, nicht überlappenden Patches und codiert die Merkmale durch sequenzielle Modellierung mit Hilfe von LSTM.
- Der zweite Weg berechnet Bild-Texturen auf mehreren Skalen unter Verwendung von Local Binary Patterns (LBP).
Die Vorteile beider Ströme werden integriert, um einen effizienten Merkmalsvektor für die Bildklassifizierung zu repräsentieren.
Die Methode wurde auf acht Datensätzen getestet, die menschliche Gesichter, Hautläsionen, Speisen, Meerestiere usw. darstellen, und verwendet vier Standard-Backbone-CNNs. DNT hat bessere Klassifizierungsgenauigkeit als bestehende Methoden erzielt.
الإحصائيات
Die Höhe und Breite der zufällig ausgewählten Löschregion IE in I werden zufällig innerhalb eines Skalierungsbereichs von [0,2; 0,8] gewählt und die Pixel werden mit dem Wert 127 gelöscht.
Die Genauigkeit der DNT-Methode auf dem FG-Net-Datensatz beträgt 55,95% unter Verwendung von DenseNet-201.
Die Genauigkeit der DNT-Methode auf dem REST-Datensatz für Handformen beträgt 85,79% unter Verwendung von DenseNet-201.
Die Genauigkeit der DNT-Methode auf dem ISIC-Datensatz für Hautläsionen beträgt 81,10% unter Verwendung von DenseNet-201.
Die Genauigkeit der DNT-Methode auf dem indischen Lebensmitteldatensatz beträgt 80,75% unter Verwendung von DenseNet-201.
Die Genauigkeit der DNT-Methode auf dem thailändischen Lebensmitteldatensatz beträgt 95,18% unter Verwendung von DenseNet-201.
اقتباسات
"Die Vorteile beider Ströme werden integriert, um einen effizienten Merkmalsvektor für die Bildklassifizierung zu repräsentieren."
"DNT hat bessere Klassifizierungsgenauigkeit als bestehende Methoden erzielt."