Core Concepts
사전 훈련된 트랜스포머 모델 Swin UNETR와 SMIT의 폐암 분할 정확도, 이상 데이터에 대한 강건성, 그리고 영상 모달리티 간 제로 샷 일반화 성능을 평가하여 이들 모델의 신뢰성을 분석하였다.
Abstract
이 연구는 폐암 분할을 위한 두 가지 대표적인 사전 훈련된 트랜스포머 모델, Swin UNETR와 SMIT의 신뢰성을 평가하였다.
정확도 평가: 두 모델 모두 공개 CT 데이터셋에서 유사한 수준의 높은 정확도를 보였으나, SMIT가 더 낮은 거짓 양성률을 나타냈다.
이상 데이터 강건성 평가: COVID-19 CT, 난소암 CT, 전립선암 MRI 등 다양한 이상 데이터에 대해 평가한 결과, SMIT가 Swin UNETR보다 더 강건한 성능을 보였다.
제로 샷 일반화 평가: 폐암 환자의 T2 강조 MRI 데이터에 대한 제로 샷 분할 실험에서 SMIT가 Swin UNETR보다 더 정확한 성능을 나타냈다.
이러한 결과는 SMIT 모델이 Swin UNETR 모델에 비해 더 신뢰할 수 있는 폐암 분할 성능을 보인다는 것을 시사한다.
Stats
폐암 CT 데이터셋(LRad)에서 Swin UNETR의 Dice 계수는 0.783 ± 0.091이고, SMIT는 0.798 ± 0.075이다.
COVID-19 CT 데이터셋에서 Swin UNETR의 AUROC는 89.19%, FPR@95는 34.62%이고, SMIT는 AUROC 89.85%, FPR@95 34.62%이다.
난소암 CT 데이터셋에서 Swin UNETR의 AUROC는 87.11%, FPR@95는 26.92%이고, SMIT는 AUROC 97.18%, FPR@95 15.38%이다.
전립선암 MRI 데이터셋에서 Swin UNETR의 AUROC는 73.80%, FPR@95는 55.77%이고, SMIT는 AUROC 92.15%, FPR@95 32.69%이다.
폐암 T2 강조 MRI 데이터셋에서 Swin UNETR의 Dice 계수는 0.693 ± 0.311이고, SMIT는 0.782 ± 0.120이다.
Quotes
"SMIT 모델이 Swin UNETR 모델에 비해 더 신뢰할 수 있는 폐암 분할 성능을 보인다."
"SMIT의 높은 이상 데이터 강건성은 지역적 및 전역적 이미지 토큰 예측과 자기 증류 네트워크의 조합 때문인 것으로 보인다."