이 논문에서는 FluoroSAM이라는 언어 정렬 파운데이션 모델을 소개한다. FluoroSAM은 1.6M개의 합성 X-선 영상 데이터셋을 기반으로 학습되었으며, 128개의 해부학적 구조와 464개의 의료 기기를 포함한다.
FluoroSAM은 텍스트 프롬프트와 포인트 프롬프트를 활용하여 X-선 영상에서 자동 및 대화형 분할을 수행할 수 있다. 텍스트 프롬프트를 통해 초기 분할을 제안하고, 포인트 프롬프트를 통해 분할 결과를 개선할 수 있다.
실험 결과, FluoroSAM은 실제 형광 X-선 영상에서 뼈 구조를 0.51의 DICE 점수로 분할할 수 있으며, 포인트 프롬프트를 추가하면 0.79의 DICE 점수로 향상된다. 또한 FluoroSAM은 훈련 데이터에 포함되지 않은 전체 폐 분할을 0.90의 DICE 점수로 수행할 수 있는 제로샷 일반화 능력을 보였다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Benjamin D. ... في arxiv.org 03-14-2024
https://arxiv.org/pdf/2403.08059.pdfاستفسارات أعمق