이 논문은 3D 의료 영상 분할을 위한 효율적이고 정확한 UNETR++ 모델을 제안한다.
UNETR++의 핵심은 효율적 paired attention (EPA) 블록의 도입이다. EPA 블록은 공간 주의와 채널 주의 메커니즘을 병렬로 적용하여 공간 및 채널 특징을 효과적으로 학습한다. 공간 주의 메커니즘은 입력 시퀀스 길이에 대해 선형 복잡도를 가지도록 설계되었다. 채널 주의 메커니즘은 채널 간 의존성을 효과적으로 학습한다. 두 메커니즘 간 강한 상관관계를 포착하기 위해 쿼리와 키 매핑 함수의 가중치를 공유한다.
UNETR++는 계층적 인코더-디코더 구조를 가지며, EPA 블록은 인코더와 디코더 모두에 적용된다. 이를 통해 정확도와 효율성을 동시에 향상시킬 수 있었다.
5개의 벤치마크 데이터셋에 대한 실험 결과, UNETR++는 기존 최고 성능 모델 대비 분할 정확도를 높이면서도 모델 복잡도를 크게 낮출 수 있었다. 특히 Synapse 데이터셋에서 UNETR++는 87.2%의 Dice 점수로 새로운 최고 성능을 달성했으며, 기존 최고 모델 대비 71% 이상의 파라미터와 FLOPs 감소를 보였다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Abdelrahman ... um arxiv.org 05-07-2024
https://arxiv.org/pdf/2212.04497.pdfTiefere Fragen