Core Concepts
비전 맘바 모듈과 증류 전략을 결합한 경량 초해상도 네트워크 DVMSR을 제안한다. DVMSR은 특징 추출 컨볼루션, 다중 적층 잔차 상태 공간 블록(RSSB), 그리고 재구성 모듈로 구성된다. 특히 RSSB는 비전 맘바 모듈(ViMM)과 컨볼루션 레이어, 그리고 잔차 연결로 구성된다. 또한 교사 네트워크의 풍부한 표현 지식을 활용하여 학생 네트워크의 성능을 향상시킨다.
Abstract
본 논문은 고효율 초해상도 모델 DVMSR을 제안한다. DVMSR은 세 가지 주요 모듈로 구성된다:
특징 추출 컨볼루션 모듈: 입력 저해상도 이미지에서 초기 특징을 추출한다.
다중 적층 잔차 상태 공간 블록(RSSB) 모듈: RSSB는 비전 맘바 모듈(ViMM), 컨볼루션 레이어, 그리고 잔차 연결로 구성된다. ViMM은 단방향 상태 공간 모델, 잔차 연결, 그리고 SiLU 활성화 함수로 이루어져 있다. 이 요소들은 모델 수렴 가속화와 정확도 및 효율성 향상에 기여한다.
재구성 모듈: 특징 융합 후 픽셀 셔플 방식으로 고해상도 이미지를 생성한다.
또한 본 논문은 교사 네트워크의 풍부한 표현 지식을 활용하여 학생 네트워크의 효율성을 향상시키는 증류 전략을 제안한다. 실험 결과, DVMSR은 기존 최신 고효율 초해상도 모델들에 비해 더 적은 파라미터로도 유사한 성능을 달성할 수 있음을 보여준다.
Stats
제안한 DVMSR 모델은 기존 최신 고효율 초해상도 모델들에 비해 더 적은 파라미터로도 유사한 PSNR 및 SSIM 성능을 달성할 수 있다.
DVMSR은 Set5 데이터셋에서 32.19 dB의 PSNR과 0.8955의 SSIM을 달성했다.
DVMSR은 Set14 데이터셋에서 28.61 dB의 PSNR과 0.7823의 SSIM을 달성했다.
Quotes
"DVMSR은 비전 맘바의 장거리 모델링 능력과 효율적인 계산 복잡성을 활용하여 고효율 초해상도를 달성한다."
"DVMSR은 교사 네트워크의 풍부한 표현 지식을 활용하여 학생 네트워크의 효율성을 향상시킨다."