Core Concepts
본 논문은 문맥 인식 및 경계 안내 네트워크(CBN)를 제안하여 기존 세그멘테이션 기반 텍스트 탐지 방법의 문제점을 해결한다. CBN은 초기 텍스트 커널 세그멘테이션 결과를 향상시키고 경계 안내 모듈을 통해 효율적이고 정확한 텍스트 경계 복원을 수행한다.
Abstract
본 논문은 세그멘테이션 기반 텍스트 탐지 방법의 문제점을 해결하기 위해 CBN을 제안한다.
- 문맥 인식 모듈:
- 각 픽셀과 텍스트 영역 간의 관계, 모든 텍스트 영역과의 관계를 각각 지역 및 전역 문맥으로 인코딩하여 초기 텍스트 커널 세그멘테이션 결과를 향상시킴.
- 경계 안내 모듈:
- 학습 가능한 거리 맵을 사용하여 텍스트 커널 경계를 정확하게 복원하고 효율적인 확장을 수행함.
제안된 CBN은 기존 세그멘테이션 기반 탐지기에 플러그 앤 플레이 방식으로 적용 가능하며, 경량 백본에서도 최신 성능을 달성할 수 있다.
Stats
각 픽셀과 해당 텍스트 인스턴스 간의 최소 거리는 ˆ
Di = min
b∈B {∥pb −pi∥2}로 계산된다.
예측된 거리 맵 Di와 실제 거리 ˆ
Di의 비율은 Ldis(Di, ˆ
Di) = ln max(Di, ˆ
Di)
min(Di, ˆ
Di)로 정의된다.
Quotes
"각 픽셀에 대한 관계를 고려하지 않고 독립적으로 예측하는 것은 문제가 있다."
"고정 값 확장이나 모든 양성 픽셀을 집계하는 방식은 효율성과 정확성 사이의 균형을 달성하기 어렵다."