Die Studie untersucht den Einsatz von sechs verschiedenen Deep-Metric-Learning-Ansätzen (Contrastive, ProxyAnchor, SoftTriple, SupCon, Triplet und NNGK) in Kombination mit vier bekannten Deep-Learning-Architekturen (ResNet18, ResNet50, VGG16 und VGG19) für die Klassifizierung von Luftbildszenen.
Die Ergebnisse zeigen, dass die Deep-Metric-Learning-Ansätze im Vergleich zu traditionellen vortrainierten CNNs bessere Klassifikationsergebnisse erzielen können. Allerdings hängt die Leistung der DML-Ansätze stark von der verwendeten Deep-Learning-Architektur ab.
Um die Klassifikationsleistung weiter zu verbessern, wird ein Ensemble-Ansatz basierend auf dem UMDA-Algorithmus vorgeschlagen. Dieser Ansatz wählt die am besten geeigneten Klassifikatoren aus dem Pool der DML+DLA-Kombinationen aus und kombiniert sie zu einem leistungsfähigeren Gesamtklassifikator. Die Experimente zeigen, dass der UMDA-basierte Ensemble-Ansatz die Klassifikationsgenauigkeit im Vergleich zu den besten Einzelklassifikatoren um mindestens 5,6% und im Vergleich zu den besten vortrainierten CNNs um bis zu 21,7% verbessern kann.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Fabi... alle arxiv.org 04-04-2024
https://arxiv.org/pdf/2303.11389.pdfDomande più approfondite