Eine neue Methode für Textspotting, die die Probleme der suboptimalen Leistung und Fehlerakkumulation in Zwei-Schritt-Textspotting-Verfahren behebt, während die Modularität beibehalten wird.
Ein neuartiger, vollständig End-to-End-Textspotter mit einem Multi-Task-Modelldesign, der Textabfragen nutzt, um die Klassifizierungs-, Segmentierungs- und Erkennungszweige miteinander zu verbinden. Er ermöglicht auch einen globalen Funktionsextraktor namens AGG, um Merkmale aus verschiedenen Orientierungen für das Lesen beliebig geformter Texte zu extrahieren.