Core Concepts
단일 소스 도메인에서 학습된 모델이 다양한 도메인에서 일관된 성능을 내도록 하기 위해 텍스트 정보를 활용하여 시각적 특징을 학습하는 접근법을 제안한다.
Abstract
이 논문은 의료 영상 분할에서 단일 소스 도메인 일반화 문제를 다룬다. 단일 소스 도메인 일반화는 다양한 도메인의 데이터를 필요로 하지 않고 단일 소스 도메인에서 학습된 모델이 다른 도메인에서도 일관된 성능을 내도록 하는 것이 목표이다.
기존 접근법들은 데이터 증강이나 특징 적응 기법을 활용하여 모델의 일반화 성능을 높이고자 했지만, 여전히 도메인 간 분포 차이로 인한 문제가 존재했다. 이 논문에서는 텍스트 정보를 활용하여 시각적 특징 학습을 개선하는 방법을 제안한다.
구체적으로, 저자들은 ChatGPT를 활용하여 해부학적 구조물의 특징을 설명하는 다양한 텍스트 설명을 생성하고, 이를 CLIP 텍스트 인코더를 통해 특징 벡터로 변환한다. 이후 이미지 특징과 텍스트 특징 간 대조 학습을 수행하여 도메인 간 일관된 특징 표현을 학습한다.
제안 방법은 다양한 실험 시나리오에서 기존 방법들을 능가하는 성능을 보였다. 특히 장기 경계 정의 측면에서 큰 향상을 보였다.
Stats
간 분할 성능이 CT에서 91.30%에서 MRI에서 98.87%로 향상되었다.
심장 분할 성능이 bSSFP에서 92.04%에서 LGE에서 91.16%로 향상되었다.
안저 분할 성능이 BinRushed 소스 도메인에서 94.98%에서 BASE1, BASE2, BASE3 타겟 도메인에서 평균 95.21%로 향상되었다.
Quotes
"단일 소스 도메인 일반화(SDG)는 실제 임상 환경에서 더 신뢰할 수 있고 일관된 영상 분할을 위한 유망한 솔루션을 제공한다."
"텍스트 정보와 시각적 특징을 결합하는 것은 데이터의 이해를 높이고 도메인 적응을 개선하는 데 도움이 될 수 있다."
"제안하는 텍스트 기반 대조 특징 정렬 기법은 다양한 시나리오에서 기존 방법들을 능가하는 성능을 보였다."