แนวคิดหลัก
Kontrastives Lernen verbessert die visuelle Repräsentation in LVLMs für textreiche Szenarien.
สถิติ
LVLMs mit DoCo erreichen überlegene Leistung.
DoCo verbessert die visuelle Repräsentation in textreichen Szenarien.
คำพูด
"LVLMs ausgestattet mit DoCo können überlegene Leistung erbringen und die Kluft zwischen visuellem Dokumentenverständnis und generischen Vision-Sprach-Aufgaben überbrücken."
"Kontrastives Lernen verbessert die visuelle Repräsentation in textreichen Szenarien."