Core Concepts
초음파 이미지에서 전립선암을 탐지하기 위해 다양한 이미지 변환기 모델의 성능을 비교하고, 멀티스케일 학습 기법을 통해 성능 향상을 달성하였다.
Abstract
이 연구는 전립선암 탐지를 위한 초음파 이미지 분석에서 이미지 변환기 모델의 성능을 평가하고 개선하는 것을 목표로 한다.
- 데이터 수집 및 전처리:
- 693명의 환자로부터 6,607개의 전립선 생검 코어 데이터를 수집하였다.
- 각 코어에서 55개의 관심영역(ROI)을 추출하여 데이터셋을 구축하였다.
- 데이터 증강 및 정규화 과정을 거쳐 데이터를 준비하였다.
- 자기지도 사전학습:
- VICReg 기법을 사용하여 모델의 사전학습을 수행하였다.
- 단일 ROI 분류 실험:
- 3가지 이미지 변환기 모델(ViT, CCT, PvT)과 ResNet18 모델을 비교하였다.
- ResNet18 모델이 가장 높은 성능을 보였다.
- 멀티스케일 분류 실험:
- ResNet18과 CCT 모델을 사용하여 멀티스케일 분류기를 학습하였다.
- 멀티목적 학습 기법을 적용하여 ROI 및 코어 단위 예측을 동시에 학습하였다.
- 멀티목적 학습을 적용한 ResNet18 모델이 가장 높은 성능을 보였다(AUROC 77.9%).
결론적으로, 초음파 데이터와 같은 작은 데이터셋에서는 합성곱 기반 모델이 변환기 모델보다 더 효과적이며, 멀티목적 학습 기법을 통해 성능을 향상시킬 수 있음을 확인하였다.
Stats
초음파 데이터에서 전립선암 탐지 성능 향상을 위해 멀티목적 학습 기법을 적용한 결과, AUROC 77.9%, 민감도 75.9%, 특이도 66.3%를 달성하였다.
Quotes
"멀티목적 ResNet18+BERT 모델이 가장 높은 성능 지표를 보였으며, AUROC 77.9%, 균형 정확도 71.1%, 민감도 75.9%를 달성하였다."
"CCT+BERT 모델은 단일 ROI 모델보다 성능이 낮았으며, AUROC 2.5% 감소, 균형 정확도 4.7% 감소를 보였다."