핵심 개념
제안된 ESTN 모델은 국부 및 전역 특징의 교대 집계를 통해 공간 및 채널 정보의 상호작용을 향상시켜 네트워크의 비선형 매핑 성능을 높입니다.
초록
이 논문은 향상된 Swin Transformer 기반 이미지 초해상도 재구성 네트워크(ESTN)를 제안합니다. ESTN은 국부-전역 특징의 교대 집계를 통해 공간 및 채널 정보의 상호작용을 향상시킵니다.
국부 특징 집계 단계에서는 이동 합성곱을 도입하여 국부 공간 정보와 채널 정보의 상호작용을 실현합니다.
전역 특징 집계 단계에서는 블록 희소 전역 인지 모듈, 다중 스케일 자기 주의 모듈, 저 매개변수 잔차 채널 주의 모듈을 도입하여 전역 정보 모델링 능력을 향상시킵니다.
다중 스케일 창 주의 메커니즘을 도입하여 공간 장거리 특징 의존성을 더 유연하게 구축합니다.
저 매개변수 잔차 채널 주의 모듈을 도입하여 피드포워드 네트워크의 채널 간 중복성 문제를 해결합니다.
국부 귀속 맵을 도입하여 선택된 영역에 대한 귀속 결과를 시각화하고, 제안된 ESTN의 우수한 이미지 재구성 성능의 이유를 밝힙니다.
실험 결과, ESTN은 다양한 벤치마크 데이터셋에서 최신 초해상도 재구성 모델을 능가하는 성능을 보여줍니다.
통계
제안된 ESTN 모델은 Manga109 데이터셋에서 ×4 배율 초해상도 재구성 시 PSNR이 31.13dB로, ELAN-light 모델보다 0.21dB 높습니다.
ESTN 모델의 매개변수 수는 883K개이고, FLOPs는 75G입니다.
인용구
"제안된 ESTN 모델은 국부-전역 특징의 교대 집계를 통해 공간 및 채널 정보의 상호작용을 향상시켜 네트워크의 비선형 매핑 성능을 높입니다."
"다중 스케일 창 주의 메커니즘을 도입하여 공간 장거리 특징 의존성을 더 유연하게 구축합니다."
"저 매개변수 잔차 채널 주의 모듈을 도입하여 피드포워드 네트워크의 채널 간 중복성 문제를 해결합니다."