핵심 개념
본 연구는 3D 전신 CT 스캔에서 107개의 해부학적 구조를 정확하고 효율적으로 분할할 수 있는 포괄적인 프롬프트 기반 3D 분할 모델 CT-SAM3D를 제안한다.
초록
이 연구는 3D 전신 CT 스캔에서 107개의 해부학적 구조를 정확하고 효율적으로 분할할 수 있는 포괄적인 프롬프트 기반 3D 분할 모델 CT-SAM3D를 제안한다.
기존 SAM 모델의 직접 적용은 의료 영상 분할 성능 저하 문제가 있어, 이를 해결하기 위해 완전 레이블링된 CT 데이터셋을 활용하여 3D 프롬프트 기반 분할 모델을 처음부터 개발했다.
3D 프롬프트 인코딩의 공간 정렬을 위해 점진적이고 공간 정렬된 프롬프트 인코딩(PSAP) 기법을 제안했다.
대형 장기 분할을 위해 패치 간 프롬프트 학습(CPP) 기법을 도입했다.
1204개의 CT 스캔으로 구성된 TotalSeg++ 데이터셋을 활용해 CT-SAM3D를 학습 및 검증했으며, 기존 SAM 기반 모델 대비 큰 성능 향상을 보였다.
실험 결과, CT-SAM3D는 FLARE22, BTCV, 자체 Chest CT 데이터셋에서 우수한 일반화 성능을 보였으며, 심지어 학습되지 않은 장기에 대해서도 효과적인 분할 성능을 보였다.
통계
전신 CT 스캔에서 107개의 해부학적 구조를 포괄적으로 분할할 수 있다.
1204개의 CT 스캔으로 구성된 TotalSeg++ 데이터셋을 활용했다.
FLARE22 데이터셋에서 5번의 클릭으로 88.4% 평균 DSC, 95.8% 평균 NSD를 달성했다.
BTCV 데이터셋에서 3번의 클릭으로 82.2% 평균 DSC, 93.9% 평균 NSD를 달성했다.
학습되지 않은 흉골 장기에 대해 5번의 클릭으로 75% 이상의 DSC를 달성했다.
인용구
"SAM의 직접 적용은 의료 영상 분할 작업에서 상당한 성능 저하를 보인다."
"3D 적응 방법은 제한된 수의 장기/종양만 분할할 수 있으며, 대규모 해부학적 범주에 대한 전이성이 검증되지 않았다."
"단순히 SAM의 2D 연산을 3D로 확장하고 데이터셋 규모를 확장하는 것만으로는 효율성과 만족스러운 결과를 얻기 어렵다."