Das vorgestellte Paper untersucht die Verwendung von synthetischen und realen Daten für das Vorabtraining von Szenentextdetektoren. Es wird eine Methode namens FreeReal vorgeschlagen, die die Stärken beider Datentypen nutzt, um die Leistung der Textdetektoren zu verbessern. Durch die Einführung von GlyphMix und Character Region Awareness werden synthetische und reale Daten effektiv integriert, um die Herausforderungen der synthetischen und sprachlichen Domain-Unterschiede zu überwinden. Experimente zeigen signifikante Leistungssteigerungen im Vergleich zu anderen komplexen Vorabtrainingsmethoden.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Tongkun Guan... lúc arxiv.org 03-12-2024
https://arxiv.org/pdf/2312.05286.pdfYêu cầu sâu hơn