Kernkonzepte
변환기 기반 블라인드 스팟 네트워크(TBSN)는 공간 및 채널 자기 주의 메커니즘을 통해 지역 적응성을 높이고 수용 영역을 크게 확장하여 자기 지도 학습 기반 이미지 복원 성능을 향상시킨다.
Zusammenfassung
이 논문은 자기 지도 학습 기반 이미지 복원을 위한 변환기 기반 블라인드 스팟 네트워크(TBSN)를 제안한다. TBSN은 기존 합성곱 기반 블라인드 스팟 네트워크의 한계를 극복하기 위해 변환기 메커니즘을 도입한다.
구체적으로:
- 공간 자기 주의 메커니즘: 주의 행렬에 정교한 마스크를 적용하여 수용 영역을 제한하여 블라인드 스팟 요구 사항을 충족한다.
- 채널 자기 주의 메커니즘: 채널 수가 공간 해상도보다 큰 경우 공간 정보가 누출될 수 있는 문제를 해결하기 위해 채널을 그룹으로 나누어 각 그룹에 대해 별도로 채널 주의를 수행한다.
- 지식 증류: 복잡한 TBSN을 단순한 U-Net으로 증류하여 추론 시 계산 비용을 크게 줄이면서도 성능을 유지한다.
실험 결과, TBSN은 기존 방법들에 비해 수용 영역을 크게 확장하고 실제 세계 이미지 복원 데이터셋에서 우수한 성능을 보인다. 또한 TBSN2UNet은 TBSN과 유사한 성능을 보이면서도 계산 비용을 크게 줄일 수 있다.
Statistiken
실제 세계 이미지 복원 데이터셋 SIDD에서 TBSN은 37.78dB PSNR을 달성하여 기존 최고 성능 대비 0.87dB 향상되었다.
실제 세계 이미지 복원 데이터셋 DND에서 TBSN은 39.08dB PSNR을 달성하여 기존 최고 성능 대비 0.65dB 향상되었다.
Zitate
"변환기 연산자는 블라인드 스팟 요구 사항을 위반할 수 있어 자기 지도 학습 기반 이미지 복원에 적용하기 어렵다."
"채널 수가 공간 해상도보다 큰 경우 채널 주의 메커니즘이 공간 정보를 누출할 수 있다."