Core Concepts
효율적이고 정확한 장면 텍스트 이미지 초해상화를 위해 의미론적 가이드를 제공하는 SGENet 모델을 제안한다.
Abstract
본 논문은 장면 텍스트 이미지 초해상화를 위한 효율적인 모델 SGENet을 제안한다. SGENet은 두 개의 브랜치로 구성되어 있다:
초해상화 브랜치: 입력 저해상도 이미지의 얕은 특징과 의미론적 가이드를 활용하여 고해상도 이미지를 생성한다.
의미론적 가이드 브랜치: 사전 학습된 경량 텍스트 인식기를 사용하여 텍스트 분포를 생성하고, 시각-의미 정렬 모듈을 통해 이미지 특징과 의미 정보를 정렬한다. 이를 통해 고품질의 의미론적 가이드를 생성한다.
제안 모델은 기존 방법들에 비해 매개변수와 계산 복잡도가 크게 감소하면서도 우수한 성능을 달성한다. 이를 통해 자원 제한적 환경에서도 효율적으로 배포할 수 있다. 실험 결과, SGENet은 기존 최신 방법 대비 성능 저하가 미미하면서도 매개변수와 계산 복잡도가 크게 감소하는 것을 확인할 수 있다.
Stats
제안 모델 SGENet은 기존 최신 방법 대비 매개변수 수가 약 85% 감소하였다.
SGENet의 계산 복잡도는 기존 최신 방법 대비 약 85% 감소하였다.
Quotes
"우리는 효율적이고 정확한 장면 텍스트 이미지 초해상화 네트워크(SGENet)를 제안한다."
"SGENet은 매개변수와 계산 복잡도가 크게 감소하면서도 우수한 성능을 달성한다."