Das Paper präsentiert LUM-ViT, eine Methode zur effizienten Datenerfassung für hyperspektrale Bilder. Es nutzt ViT als Backbone-Netzwerk und ein DMD-Signalerfassungssystem für die Patch-Einbettung, um eine optische Modulation vor der Datenerfassung zu ermöglichen. Durch eine lernbare Maske werden wichtige Punkte isoliert, während weniger wichtige Punkte umgangen werden, um eine Unterabtastung zu erreichen. Die Ergebnisse zeigen eine geringe Genauigkeitsverlust bei extrem niedrigen Unterabtastungsraten. Realweltexperimente bestätigen die praktische Durchführbarkeit von LUM-ViT.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Lingfeng Liu... alle arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01412.pdfDomande più approfondite