Core Concepts
WiTUnet은 CNN과 Transformer를 통합한 U자형 구조로, 특징 맵 정렬 및 지역 정보 융합을 개선하여 저선량 CT 영상의 노이즈 제거와 화질 향상을 달성한다.
Abstract
이 논문은 저선량 CT(LDCT) 영상의 노이즈 제거와 화질 향상을 위한 새로운 인코더-디코더 구조인 WiTUnet을 소개한다. WiTUnet은 CNN과 Transformer를 통합하여 전역 정보와 지역 정보를 모두 효과적으로 활용한다.
주요 내용은 다음과 같다:
- 인코더와 디코더 간 특징 맵 정렬을 개선하기 위해 중첩 밀집 건너뛰기 경로(nested dense skip pathway)를 도입했다.
- 계산 복잡도를 낮추면서도 전역 정보 모델링 능력을 높이기 위해 창 기반 Transformer(Window Transformer) 구조를 사용했다.
- CNN의 지역 정보 캡처 능력을 향상시키기 위해 기존 MLP 대신 지역 정보 인지 강화(LiPe) 모듈을 도입했다.
실험 결과, WiTUnet은 기존 방법들에 비해 PSNR, SSIM, RMSE 등의 지표에서 우수한 성능을 보였다. 이를 통해 WiTUnet이 LDCT 영상의 노이즈 제거와 화질 개선에 효과적임을 확인할 수 있다.
Stats
LDCT 영상은 일반 CT 영상에 비해 노이즈가 심하고 화질이 저하된다.
WiTUnet은 PSNR 33.2851, SSIM 0.9187, RMSE 8.8434의 성능을 보였다.
이는 기존 방법들인 DnCNN, REDCNN, ADNet, NBNet, CTformer에 비해 우수한 수준이다.
Quotes
"WiTUnet은 CNN과 Transformer를 통합한 U자형 구조로, 특징 맵 정렬 및 지역 정보 융합을 개선하여 저선량 CT 영상의 노이즈 제거와 화질 향상을 달성한다."
"WiTUnet은 PSNR 33.2851, SSIM 0.9187, RMSE 8.8434의 성능을 보였다."