Die Studie präsentiert ein Context-aware and Boundary-guided Network (CBN), das die Probleme der herkömmlichen segmentierungsbasierten Texterkennungsmethoden adressiert.
Zunächst wird ein context-aware Modul eingeführt, um die Beziehungen zwischen Pixeln und Textregionen zu erfassen und die anfänglichen Segmentierungsergebnisse zu verbessern. Dazu werden globale und lokale Kontextinformationen genutzt.
Anschließend wird ein boundary-guided Modul vorgestellt, das die erweiterten Textkerne adaptiv an die tatsächlichen Textgrenzen anpasst. Dafür wird eine lernbare Distanzkarte verwendet, die eine effiziente und genaue Rekonstruktion der Textumrisse ermöglicht.
Die Experimente zeigen, dass das vorgeschlagene CBN-Netzwerk, das als leichtgewichtiges Plugin in bestehende segmentierungsbasierte Detektoren integriert werden kann, state-of-the-art Ergebnisse auf mehreren Benchmarks erzielt, bei gleichzeitig konkurrenzfähiger Inferenzgeschwindigkeit.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Xi Zhao,Wei ... lúc arxiv.org 03-22-2024
https://arxiv.org/pdf/2212.02340.pdfYêu cầu sâu hơn