核心概念
DeblurDiNAT은 실제 세계의 흐릿한 이미지를 효과적이고 효율적으로 복원하는 경량 트랜스포머 모델이다.
摘要
이 논문은 DeblurDiNAT이라는 새로운 이미지 디블러링 트랜스포머 모델을 제안한다. 주요 내용은 다음과 같다:
- 교대 팽창 요인 구조(Alternating Dilation Factor Structure, ADFS)를 도입하여 전역적 및 지역적 흐릿한 패턴을 모두 학습할 수 있다.
- 채널 변조 자기 주의(Channel Modulation Self Attention, CMSA) 블록을 제안하여 채널 간 관계를 효과적으로 모델링한다.
- 빠른 특징 전파를 위한 나누기 및 곱하기 피드포워드 네트워크(Divide and Multiply Feed-Forward Network, DMFN)를 개발했다.
- 경량 게이트 특징 융합(Lightweight Gated Feature Fusion, LGFF) 모듈을 설계하여 다중 스케일 및 동일 스케일 특징 융합을 수행한다.
- 광범위한 실험 결과, DeblurDiNAT은 효과, 효율성 및 일반화 능력 면에서 최신 기술을 능가한다.
统计
제안된 DeblurDiNAT-L 모델은 기존 최고 성능 모델 FFTformer보다 PSNR 0.08dB 높다.
DeblurDiNAT-L은 FFTformer보다 GPU 메모리 사용량이 61% 적고, 3.21배 더 빠르다.
DeblurDiNAT-S는 최고 성능 CNN 모델 MPRNet과 유사한 디블러링 품질을 보이지만, FLOPs는 87% 적고 추론 시간은 53% 더 빠르다.
引用
"DeblurDiNAT은 실제 세계의 흐릿한 이미지를 효과적이고 효율적으로 복원하는 경량 트랜스포머 모델이다."
"DeblurDiNAT은 효과, 효율성 및 일반화 능력 면에서 최신 기술을 능가한다."