핵심 개념
의료 영상 분할 모델 학습을 위해 전문가가 아닌 사용자가 생성한 희소 주석을 활용하는 것은 효과적이지 않다. 전문가 수준의 주석이 필요하며, 이를 위해서는 3D 의료 영상 분할에 특화된 기반 모델 개발이 필요하다.
초록
이 연구는 의료 영상 분할을 위한 데이터 주석 작성 과정을 효율화하기 위해 Segment Anything Model(SAM)을 활용하는 방안을 탐구했다.
시뮬레이션 실험에서는 이상적인 시나리오에서 SAM이 생성한 주석이 전문가 주석과 유사한 수준의 성능을 보였다. 하지만 실제 비전문가 참여자를 통한 군중 소싱 실험에서는 SAM 기반 주석이 전문가 주석 대비 유의미하게 낮은 성능을 보였다. 이는 SAM이 2D 의료 영상 분할에 최적화되어 있어 3D 공간 관계를 충분히 반영하지 못하기 때문이다.
따라서 의료 영상 분할을 위한 데이터 주석 작성 과정을 효율화하기 위해서는 3D 의료 영상 분할에 특화된 기반 모델 개발이 필요하다. 또한 주석의 품질 관리를 위한 메커니즘 도입이 중요하다.
통계
SAM 기반 주석의 평균 볼륨 Dice 점수는 BTCV 훈련 데이터셋에서 0.75 ± 0.09로, MedSAM 기반 주석의 0.74 ± 0.09와 유사했다(p=0.70).
SAM-nnU-Net 모델의 평균 Dice 점수는 BTCV 테스트 데이터셋에서 0.77 ± 0.06으로, GT-nnU-Net 모델의 0.91 ± 0.05보다 유의미하게 낮았다(p<0.001).