Das Paper präsentiert LUM-ViT, eine Methode zur effizienten Datenerfassung für hyperspektrale Bilder. Es nutzt ViT als Backbone-Netzwerk und ein DMD-Signalerfassungssystem für die Patch-Einbettung, um eine optische Modulation vor der Datenerfassung zu ermöglichen. Durch eine lernbare Maske werden wichtige Punkte isoliert, während weniger wichtige Punkte umgangen werden, um eine Unterabtastung zu erreichen. Die Ergebnisse zeigen eine geringe Genauigkeitsverlust bei extrem niedrigen Unterabtastungsraten. Realweltexperimente bestätigen die praktische Durchführbarkeit von LUM-ViT.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Lingfeng Liu... kl. arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01412.pdfDybere Forespørgsler