核心概念
Effiziente Datenerfassung durch LUM-ViT für hyperspektrale Bilder.
摘要
Das Paper präsentiert LUM-ViT, eine Methode zur effizienten Datenerfassung für hyperspektrale Bilder. Es nutzt ViT als Backbone-Netzwerk und ein DMD-Signalerfassungssystem für die Patch-Einbettung, um eine optische Modulation vor der Datenerfassung zu ermöglichen. Durch eine lernbare Maske werden wichtige Punkte isoliert, während weniger wichtige Punkte umgangen werden, um eine Unterabtastung zu erreichen. Die Ergebnisse zeigen eine geringe Genauigkeitsverlust bei extrem niedrigen Unterabtastungsraten. Realweltexperimente bestätigen die praktische Durchführbarkeit von LUM-ViT.
Inhaltsverzeichnis
- Einführung
- Verwandte Arbeiten
- Methode
- Vorarbeiten
- Lernbare Unterabtastungsmaske
- Kernel-Level Gewichts-Binarisierung
- Experimente
- Training Phase
- Real-World Application Phase
- Hyperspektrale Bildklassifikation
- Schlussfolgerung
統計資料
Unsere Experimente zeigen, dass LUM-ViT bei einer Unterabtastungsrate von weniger als 10% einen geringen Genauigkeitsverlust von 1,8% aufweist.
Die Genauigkeit von LUM-ViT in realen Tests liegt 4% unter den Softwareergebnissen aufgrund von Hardwarefehlern.
引述
"Unsere Evaluierungen zeigen, dass LUM-ViT bei einer Unterabtastung von nur 10% die Genauigkeitsverluste bei der ImageNet-Klassifizierung innerhalb von 1,8% hält."