本研究は、低照度環境における任意形状の文字検出に取り組んでいる。従来の二段階アプローチ(低照度画像の増強→文字検出)では、増強処理が文字の特徴を損なう可能性があるため、単一段階のアプローチを提案している。
具体的には以下の取り組みを行っている:
空間制約学習モジュールを導入し、文字の位置情報と文脈情報を保持するようネットワークを学習させる。これにより、低照度環境下でも文字の特徴を効果的に捉えることができる。
文字の局所的な特徴を捉えるためにDynamic Snake Convolutionを導入し、文字の形状的特徴を強調する。また、底上げ型のアプローチを採用し、文字の輪郭を柔軟にモデル化する。
低照度環境における任意形状文字検出のための新規データセットLATeDを構築した。これにより、実世界の低照度シーンにおける文字検出の評価が可能となった。
提案手法は、低照度環境下でも高精度な文字検出を実現し、従来手法を大きく上回る性能を示している。また、通常照度環境でも高い精度を達成しており、汎用性の高い手法であることが確認された。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Chengpei Xu,... om arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.08965.pdfDiepere vragen