本論文では、任意形状のシーンテキスト検出のための新しいアプローチ「MorphText」を提案している。従来の手法には2つの問題点があった:1) 誤検出されたテキストセグメントの蓄積、2) テキストセグメント間の信頼できる接続の構築が困難。これらの問題に取り組むため、MorphTextでは深い形態学モジュールを設計し、テキストセグメントを正則化し、それらの接続を決定する。
まず、Deep Morphological Opening (DMOP)モジュールを構築し、特徴抽出プロセスで生成された誤ったテキストセグメントを除去する。次に、Deep Morphological Closing (DMCL)モジュールを提案し、様々な形状のテキスト領域が最も重要な方向に沿って伸張し、接続を導出できるようにする。
4つの主要ベンチマークデータセットでの実験結果から、提案するMorphTextが最先端の任意形状テキスト検出手法を上回ることが示された。これは、深い形態学を任意形状テキスト検出に初めて導入した成果である。
To Another Language
from source content
arxiv.org
Ключові висновки, отримані з
by Chengpei Xu,... о arxiv.org 04-29-2024
https://arxiv.org/pdf/2404.17151.pdfГлибші Запити