Effizientes Verfahren zur Verarbeitung und Analyse von Inhalten für Erkenntnisse
VIT-LENS ermöglicht eine effiziente omni-modale Repräsentationslernung, indem es neuartige Modalitäten mit einem vortrainierten ViT wahrnimmt und an einen vordefinierter Raum ausrichtet.