이 연구에서는 TransRUPNet이라는 새로운 딥러닝 기반 모델을 제안했다. TransRUPNet은 인코더-디코더 구조로 구성되어 있으며, 사전 학습된 Pyramid Vision Transformer (PVT)를 인코더로 사용하고 있다. 이를 통해 다양한 계층의 특징을 효과적으로 추출할 수 있다. 또한 업샘플링 블록과 디코더 블록을 추가하여 정확한 용종 분할 마스크를 생성한다.
실험 결과, TransRUPNet은 Kvasir-SEG 데이터셋에서 기존 최신 기법들을 능가하는 성능을 보였다. 평균 Dice 계수 0.9005, mIoU 0.8445, 재현율 0.9195, 정밀도 0.9170, F2-score 0.9048을 달성했다. 또한 초당 47.07 프레임의 실시간 처리 속도를 보였다.
더불어 TransRUPNet은 다양한 국가의 OOD(Out-of-Distribution) 데이터셋에서도 우수한 일반화 성능을 보였다. PolypGen, CVC-ClinicDB, BKAI-IGH 데이터셋에서 기존 최신 기법들을 크게 능가하는 분할 성능을 달성했다. 이를 통해 TransRUPNet이 실제 임상에서 활용될 수 있는 강력한 대장 용종 분할 모델임을 입증했다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Debesh Jha,N... at arxiv.org 05-02-2024
https://arxiv.org/pdf/2306.02176.pdfDeeper Inquiries