TextMonkey: Ein OCR-freies großes multimodales Modell für das Verständnis von Dokumenten
TextMonkey ist ein großes multimodales Modell, das für textzentrierte Aufgaben entwickelt wurde und eine signifikante Leistungssteigerung bei verschiedenen Benchmark-Datensätzen erzielt hat.