Die Studie präsentiert ein Context-aware and Boundary-guided Network (CBN), das die Probleme der herkömmlichen segmentierungsbasierten Texterkennungsmethoden adressiert.
Zunächst wird ein context-aware Modul eingeführt, um die Beziehungen zwischen Pixeln und Textregionen zu erfassen und die anfänglichen Segmentierungsergebnisse zu verbessern. Dazu werden globale und lokale Kontextinformationen genutzt.
Anschließend wird ein boundary-guided Modul vorgestellt, das die erweiterten Textkerne adaptiv an die tatsächlichen Textgrenzen anpasst. Dafür wird eine lernbare Distanzkarte verwendet, die eine effiziente und genaue Rekonstruktion der Textumrisse ermöglicht.
Die Experimente zeigen, dass das vorgeschlagene CBN-Netzwerk, das als leichtgewichtiges Plugin in bestehende segmentierungsbasierte Detektoren integriert werden kann, state-of-the-art Ergebnisse auf mehreren Benchmarks erzielt, bei gleichzeitig konkurrenzfähiger Inferenzgeschwindigkeit.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Xi Zhao,Wei ... ב- arxiv.org 03-22-2024
https://arxiv.org/pdf/2212.02340.pdfשאלות מעמיקות