แนวคิดหลัก
본 연구는 하향식 및 상향식 임의 형태 장면 텍스트 검출 방법의 한계를 해결하기 위해 깊은 형태학 기반 정규화 기법을 제안한다. 제안 방법은 텍스트 세그먼트 검출 과정에서 발생하는 오탐지를 제거하고 분리된 텍스트 세그먼트 간 연결을 강화한다.
บทคัดย่อ
본 논문은 임의 형태 장면 텍스트 검출을 위한 새로운 접근법인 "MorphText"를 제안한다. 이를 위해 두 가지 깊은 형태학 모듈을 설계하였다:
- 깊은 형태학 열기(DMOP) 모듈: 특징 추출 과정에서 발생하는 잘못된 텍스트 세그먼트 검출을 제거한다.
- 깊은 형태학 닫기(DMCL) 모듈: 다양한 형태의 텍스트 인스턴스가 가장 중요한 방향으로 늘어나도록 하여 텍스트 세그먼트 간 연결을 유도한다.
제안 방법은 기존 하향식 및 상향식 방법의 한계를 해결하고자 한다. 하향식 방법은 텍스트의 특성을 충분히 고려하지 않아 긴 텍스트 검출에 어려움이 있다. 상향식 방법은 오탐지 누적과 세그먼트 간 연결 문제에 취약하다.
본 연구는 깊은 형태학 기반 정규화를 통해 이러한 문제를 해결하고자 한다. 실험 결과, 제안 방법은 다양한 벤치마크 데이터셋에서 최신 기법을 능가하는 성능을 보였다.
สถิติ
제안 방법은 기존 하향식 및 상향식 방법 대비 CTW1500 데이터셋에서 1.8%, Total-Text 데이터셋에서 1.3% 더 높은 F-measure 성능을 달성했다.
DMOP와 DMCL 모듈은 상호 보완적으로 작용하여 최종 성능 향상에 기여했다.
2x2와 3x3 크기의 구조 요소가 가장 좋은 성능을 보였다.
잔차 연결은 과도한 보정을 방지하여 성능 향상에 도움이 되었다.
คำพูด
"하향식 방법은 텍스트의 특성을 충분히 고려하지 않아 긴 텍스트 검출에 어려움이 있다."
"상향식 방법은 오탐지 누적과 세그먼트 간 연결 문제에 취약하다."
"제안 방법은 깊은 형태학 기반 정규화를 통해 이러한 문제를 해결하고자 한다."