Conceitos essenciais
제안된 ESTN(Enhanced Swin Transformer Network) 모델은 국부 및 전역 특징의 교대 집계를 통해 공간 및 채널 정보의 상호작용을 향상시켜 네트워크의 비선형 매핑 성능을 높입니다. 또한 다중 스케일 윈도우 주의 메커니즘, 저파라미터 잔차 채널 주의 모듈 등의 혁신적인 기술을 도입하여 우수한 이미지 재구성 성능을 달성합니다.
Resumo
이 논문은 향상된 Swin Transformer 기반 이미지 초해상도 재구성 네트워크(ESTN)를 제안합니다.
- 국부 특징 집계 단계:
- 이동 합성곱(Shift Convolution)을 도입하여 국부 공간 정보와 채널 정보의 상호작용을 실현합니다.
- 전역 특징 집계 단계:
- 블록 희소 전역 인지 모듈(BSGM)을 도입하여 전역 인지 능력을 향상시킵니다.
- 다중 스케일 자기 주의 모듈(W-MSSA, SW-MSSA)을 도입하여 다중 스케일 정보 학습 능력을 향상시킵니다.
- 저파라미터 잔차 채널 주의 모듈(LRCAB)을 도입하여 채널 간 중복성 문제를 해결합니다.
- 실험 결과:
- 제안된 ESTN 모델은 다양한 벤치마크 데이터셋에서 최신 초해상도 모델들을 능가하는 성능을 보여줍니다.
- 국부 귀속 맵(LAM)을 통해 ESTN의 수용 영역이 다른 모델들보다 크다는 것을 확인할 수 있습니다.
Estatísticas
제안된 ESTN 모델은 Manga109 데이터셋에서 ×4 배율 초해상도 복원 시 PSNR이 30.87dB, SSIM이 0.9128로 우수한 성능을 보여줍니다.
ESTN 모델의 FLOPs는 75G, 파라미터 수는 883K입니다.
Citações
"제안된 ESTN 모델은 국부 및 전역 특징의 교대 집계를 통해 공간 및 채널 정보의 상호작용을 향상시켜 네트워크의 비선형 매핑 성능을 높입니다."
"다중 스케일 윈도우 주의 메커니즘, 저파라미터 잔차 채널 주의 모듈 등의 혁신적인 기술을 도입하여 우수한 이미지 재구성 성능을 달성합니다."