Główne pojęcia
FluoroSAM은 다양한 해부학적 구조와 의료 기기를 포함하는 1.6M개의 합성 X-선 영상 데이터셋을 기반으로 학습된 언어 정렬 파운데이션 모델로, 텍스트 프롬프트와 포인트 프롬프트를 활용하여 X-선 영상에서 자동 및 대화형 분할을 수행할 수 있다.
Streszczenie
이 논문에서는 FluoroSAM이라는 언어 정렬 파운데이션 모델을 소개한다. FluoroSAM은 1.6M개의 합성 X-선 영상 데이터셋을 기반으로 학습되었으며, 128개의 해부학적 구조와 464개의 의료 기기를 포함한다.
FluoroSAM은 텍스트 프롬프트와 포인트 프롬프트를 활용하여 X-선 영상에서 자동 및 대화형 분할을 수행할 수 있다. 텍스트 프롬프트를 통해 초기 분할을 제안하고, 포인트 프롬프트를 통해 분할 결과를 개선할 수 있다.
실험 결과, FluoroSAM은 실제 형광 X-선 영상에서 뼈 구조를 0.51의 DICE 점수로 분할할 수 있으며, 포인트 프롬프트를 추가하면 0.79의 DICE 점수로 향상된다. 또한 FluoroSAM은 훈련 데이터에 포함되지 않은 전체 폐 분할을 0.90의 DICE 점수로 수행할 수 있는 제로샷 일반화 능력을 보였다.
Statystyki
X-선 영상에서 뼈 구조를 텍스트 프롬프트만으로 0.51의 DICE 점수로 분할할 수 있다.
포인트 프롬프트를 추가하면 뼈 구조 분할 성능이 0.79의 DICE 점수로 향상된다.
전체 폐 분할을 0.90의 DICE 점수로 수행할 수 있는 제로샷 일반화 능력을 보였다.
Cytaty
"FluoroSAM은 텍스트 프롬프트와 포인트 프롬프트를 활용하여 X-선 영상에서 자동 및 대화형 분할을 수행할 수 있다."
"FluoroSAM은 실제 형광 X-선 영상에서 뼈 구조를 0.51의 DICE 점수로 분할할 수 있으며, 포인트 프롬프트를 추가하면 0.79의 DICE 점수로 향상된다."
"FluoroSAM은 훈련 데이터에 포함되지 않은 전체 폐 분할을 0.90의 DICE 점수로 수행할 수 있는 제로샷 일반화 능력을 보였다."