核心概念
HMT-UNet은 상태 공간 모델(SSM)과 트랜스포머의 하이브리드 메커니즘을 활용하여 의료 영상 분할 성능을 향상시킨다.
要約
이 논문에서는 의료 영상 분할을 위한 새로운 모델인 HMT-UNet을 제안한다. HMT-UNet은 상태 공간 모델(SSM)인 맘바와 트랜스포머 아키텍처를 결합한 모델이다.
HMT-UNet의 구조는 다음과 같다:
- 인코더: 합성곱 모듈과 맘바 비전 믹서로 구성
- 디코더: 맘바 비전 믹서, 업샘플링 연산, 합성곱 모듈, 최종 선형 레이어로 구성
- 스킵 연결: 단순한 덧셈 연산 사용
맘바는 선형 시간 복잡도를 가지며 장거리 의존성 모델링에 뛰어나다. 트랜스포머는 어댑티브 어텐션 메커니즘과 멀티모달 적응성으로 강점을 가진다. 두 모델의 장점을 결합한 HMT-UNet은 의료 영상 분할 성능을 크게 향상시킬 수 있다.
실험 결과, HMT-UNet은 ISIC17, ISIC18, Kvasir-SEG, ClinicDB, ColonDB, ETIS, ZD-LCI-GIM 데이터셋에서 우수한 성능을 보였다. 이를 통해 순수 맘바 기반 모델이 의료 영상 분할 태스크에서 매우 경쟁력 있음을 확인할 수 있다.
統計
의료 영상 분할 태스크에서 HMT-UNet은 IOU 83.05%, DSC 90.74%, Acc 96.88%의 성능을 보였다.
피부 병변 데이터셋 ISIC17에서 HMT-UNet은 IOU 83.05%, DSC 90.74%, Acc 96.88%의 성능을 보였다.
위장관 폴립 데이터셋 Kvasir-SEG에서 HMT-UNet은 IOU 85.66%, DSC 92.28%, Acc 97.69%의 성능을 보였다.
위장관 GIM 데이터셋 ZD-LCI-GIM에서 HMT-UNet은 IOU 57.3%, DSC 72.86%, Acc 86.61%의 성능을 보였다.
引用
"HMT-UNet은 상태 공간 모델(SSM)과 트랜스포머의 하이브리드 메커니즘을 활용하여 의료 영상 분할 성능을 향상시킨다."
"맘바는 선형 시간 복잡도를 가지며 장거리 의존성 모델링에 뛰어나고, 트랜스포머는 어댑티브 어텐션 메커니즘과 멀티모달 적응성으로 강점을 가진다."
"실험 결과, HMT-UNet은 다양한 의료 영상 데이터셋에서 우수한 성능을 보였다."