核心概念
본 논문은 다중 헤드 어텐션 메커니즘을 활용하여 전체 슬라이드 이미지의 다양한 측면을 포착하고 모델 복잡성을 줄이는 MAD-MIL 모델을 제안한다. MNIST-BAGS와 TUPAC16, TCGA BRCA, TCGA LUNG, TCGA KIDNEY 데이터셋에서 평가한 결과, MAD-MIL은 ABMIL을 능가하고 CLAM, DS-MIL과 유사한 성능을 보였다.
摘要
본 논문은 전체 슬라이드 이미지(WSI)의 약한 감독 분류를 위한 MAD-MIL 모델을 제안한다.
- 문제 정의:
- WSI를 N개의 작은 인스턴스로 분할하여 가방(bag)을 생성한다.
- 가방 레이블은 적어도 하나의 양성 인스턴스가 있는지 여부에 따라 결정된다.
- 목표는 WSI의 슬라이드 레이블 Y를 예측하는 것이다.
- ABMIL 모델:
- 어텐션 메커니즘을 사용하여 각 인스턴스의 중요도를 학습하고 슬라이드 임베딩을 생성한다.
- 이를 통해 모델의 해석 가능성이 향상된다.
- MAD-MIL 모델:
- 변형된 다중 헤드 어텐션 메커니즘을 사용하여 입력 WSI의 다양한 측면을 포착한다.
- 이를 통해 정보 다양성, 해석 가능성, 효율성이 향상된다.
- 모델 복잡성과 파라미터 수가 감소한다.
- 실험 결과:
- MNIST-BAGS, TUPAC16, TCGA BRCA/LUNG/KIDNEY 데이터셋에서 평가
- MAD-MIL은 ABMIL을 능가하고 CLAM, DS-MIL과 유사한 성능을 보였다.
- 다중 헤드 어텐션을 통해 슬라이드 표현의 다양성과 해석 가능성이 향상되었다.
統計資料
양성 가방에 키 인스턴스가 40%, 60%, 80% 존재하고 음성 가방에 20%, 40%, 60% 존재하는 경우, MAD-MIL은 ABMIL 대비 AUC가 4.3% 향상되었고 F1 점수가 12.7% 향상되었다.
TUPAC16 데이터셋에서 MAD-MIL은 AUC 0.802, F1 0.735를 달성하여 ABMIL 대비 성능이 향상되었다.
TCGA BRCA 데이터셋에서 MAD-MIL은 AUC 0.897, F1 0.791로 ABMIL을 능가했다.
TCGA LUNG 데이터셋에서 MAD-MIL은 AUC 0.940, F1 0.872로 ABMIL을 능가했다.
TCGA KIDNEY 데이터셋에서 MAD-MIL은 AUC 0.985, F1 0.898로 ABMIL을 능가했다.
引述
"MAD-MIL 모델은 다중 헤드 어텐션 메커니즘을 활용하여 입력 WSI의 다양한 측면을 포착하고 모델 복잡성을 줄였다."
"MAD-MIL은 ABMIL을 능가하고 CLAM, DS-MIL과 유사한 성능을 보였다."
"다중 헤드 어텐션을 통해 슬라이드 표현의 다양성과 해석 가능성이 향상되었다."