Die Studie präsentiert ein Context-aware and Boundary-guided Network (CBN), das die Probleme der herkömmlichen segmentierungsbasierten Texterkennungsmethoden adressiert.
Zunächst wird ein context-aware Modul eingeführt, um die Beziehungen zwischen Pixeln und Textregionen zu erfassen und die anfänglichen Segmentierungsergebnisse zu verbessern. Dazu werden globale und lokale Kontextinformationen genutzt.
Anschließend wird ein boundary-guided Modul vorgestellt, das die erweiterten Textkerne adaptiv an die tatsächlichen Textgrenzen anpasst. Dafür wird eine lernbare Distanzkarte verwendet, die eine effiziente und genaue Rekonstruktion der Textumrisse ermöglicht.
Die Experimente zeigen, dass das vorgeschlagene CBN-Netzwerk, das als leichtgewichtiges Plugin in bestehende segmentierungsbasierte Detektoren integriert werden kann, state-of-the-art Ergebnisse auf mehreren Benchmarks erzielt, bei gleichzeitig konkurrenzfähiger Inferenzgeschwindigkeit.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Xi Zhao,Wei ... kl. arxiv.org 03-22-2024
https://arxiv.org/pdf/2212.02340.pdfDybere Forespørgsler