Khái niệm cốt lõi
기존 텍스트 스포팅 기법의 단점을 해결하면서도 모듈성을 유지하는 새로운 접근법인 Bridging Text Spotting을 제안한다.
Tóm tắt
이 논문은 기존 텍스트 스포팅 기법의 단점을 해결하면서도 모듈성을 유지하는 새로운 접근법인 Bridging Text Spotting을 소개한다.
기존 두 단계 텍스트 스포팅 기법은 모듈성이 높지만 오류 누적과 성능 저하 문제가 있었다. 반면 end-to-end 텍스트 스포팅 기법은 이러한 문제를 해결했지만 모듈성이 낮다는 단점이 있었다.
Bridging Text Spotting은 이러한 문제를 해결하기 위해 다음과 같은 방법을 제안한다:
- 잘 훈련된 탐지기와 인식기를 사용하고 그 매개변수를 고정시켜 기존 성능을 유지한다.
- 이 두 모듈을 연결하는 Bridge를 도입한다. Bridge는 탐지 특징을 인식기에 효과적으로 전달한다.
- Adapter를 사용하여 고정된 탐지기와 인식기가 end-to-end 최적화 특징을 효율적으로 학습할 수 있게 한다.
실험 결과, Bridging Text Spotting은 기존 최신 기법들을 능가하는 성능을 보였으며, 다양한 탐지기-인식기 조합에서도 일관되게 성능 향상을 달성했다.
Thống kê
제안 방법의 Total-Text 데이터셋 성능은 83.3%로, 기존 최고 성능 대비 4.6% 향상되었다.
제안 방법의 CTW1500 데이터셋 성능은 69.8%로, 기존 최고 성능 대비 4.9% 향상되었다.
제안 방법의 ICDAR 2015 데이터셋 성능은 89.5%로, 기존 최고 성능 대비 1.6% 향상되었다.
Trích dẫn
"Modularity plays a crucial role in the development and maintenance of complex systems."
"Bridging Text Spotting, a novel approach that resolves the error accumulation and suboptimal performance issues in two-step methods while retaining modularity."
"Benefiting from the utilization of the well-trained detector and recognizer, Bridge with Adapter eliminates the need for extensive data and enables a rapid completion of the training process."