Das Paper präsentiert LUM-ViT, eine Methode zur effizienten Datenerfassung für hyperspektrale Bilder. Es nutzt ViT als Backbone-Netzwerk und ein DMD-Signalerfassungssystem für die Patch-Einbettung, um eine optische Modulation vor der Datenerfassung zu ermöglichen. Durch eine lernbare Maske werden wichtige Punkte isoliert, während weniger wichtige Punkte umgangen werden, um eine Unterabtastung zu erreichen. Die Ergebnisse zeigen eine geringe Genauigkeitsverlust bei extrem niedrigen Unterabtastungsraten. Realweltexperimente bestätigen die praktische Durchführbarkeit von LUM-ViT.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Lingfeng Liu... ב- arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01412.pdfשאלות מעמיקות