Die Studie präsentiert ein Context-aware and Boundary-guided Network (CBN), das die Probleme der herkömmlichen segmentierungsbasierten Texterkennungsmethoden adressiert.
Zunächst wird ein context-aware Modul eingeführt, um die Beziehungen zwischen Pixeln und Textregionen zu erfassen und die anfänglichen Segmentierungsergebnisse zu verbessern. Dazu werden globale und lokale Kontextinformationen genutzt.
Anschließend wird ein boundary-guided Modul vorgestellt, das die erweiterten Textkerne adaptiv an die tatsächlichen Textgrenzen anpasst. Dafür wird eine lernbare Distanzkarte verwendet, die eine effiziente und genaue Rekonstruktion der Textumrisse ermöglicht.
Die Experimente zeigen, dass das vorgeschlagene CBN-Netzwerk, das als leichtgewichtiges Plugin in bestehende segmentierungsbasierte Detektoren integriert werden kann, state-of-the-art Ergebnisse auf mehreren Benchmarks erzielt, bei gleichzeitig konkurrenzfähiger Inferenzgeschwindigkeit.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Xi Zhao,Wei ... في arxiv.org 03-22-2024
https://arxiv.org/pdf/2212.02340.pdfاستفسارات أعمق