Core Concepts
CT 영상과 방사선과 보고서를 활용하여 별도의 수동 라벨링 없이도 다중 이상 징후를 효과적으로 검출할 수 있는 모델을 개발하였다.
Abstract
이 연구에서는 CT 영상과 방사선과 보고서로 구성된 새로운 데이터셋 CT-RATE를 소개하고, 이를 활용하여 CT 영상의 다중 이상 징후를 검출할 수 있는 CT-CLIP 모델을 개발하였다.
CT-RATE 데이터셋은 25,692개의 비조영 흉부 CT 영상과 21,304명의 환자에 대한 방사선과 보고서로 구성되어 있다. 이 데이터셋은 공개되어 3D 의료 영상 연구에 활용될 수 있다.
CT-CLIP 모델은 CT 영상과 방사선과 보고서를 활용하여 사전 학습된 범용 모델로, 별도의 수동 라벨링 없이도 다중 이상 징후를 효과적으로 검출할 수 있다. 실험 결과, CT-CLIP은 완전 지도 학습 모델보다 우수한 성능을 보였다. 또한 CT-CLIP은 CT 영상 검색 등 다양한 응용 분야에서 활용될 수 있다.
이 연구는 3D 의료 영상 분석 분야에 중요한 기여를 하였으며, CT-RATE 데이터셋과 CT-CLIP 모델의 공개를 통해 의료 AI 커뮤니티에 큰 도움이 될 것으로 기대된다.
Stats
이 연구에서 사용된 CT-RATE 데이터셋은 총 50,188개의 재구성된 비조영 흉부 CT 영상으로 구성되어 있다.
이 CT 영상은 21,304명의 환자로부터 수집되었으며, 이 중 20,000명은 학습 데이터로, 1,304명은 검증 데이터로 사용되었다.
환자들의 평균 나이는 48.8세이며, 성별 분포는 여성 41.6%, 남성 58.4%이다.
CT 스캐너는 Philips(61.5%), Siemens(30.1%), PNMS(8.4%) 제품이 사용되었다.
CT 영상의 해상도는 512 x 512 px(65.4%), 768 x 768 px(4.2%), 1024 x 1024 px(30.4%)이며, 슬라이스 수는 100~600장 범위로 다양하다.
Quotes
"CT-CLIP은 별도의 수동 라벨링 없이도 다중 이상 징후를 효과적으로 검출할 수 있다."
"CT-CLIP은 완전 지도 학습 모델보다 우수한 성능을 보였다."
"CT-RATE 데이터셋과 CT-CLIP 모델의 공개를 통해 의료 AI 커뮤니티에 큰 도움이 될 것으로 기대된다."