본 연구에서는 고해상도(1280 x 1280) X-ray 이미지 기반 사전 학습 모델을 제안한다. 기존 X-ray 기반 사전 학습 모델들은 상대적으로 작은 규모의 데이터셋(50만 개 미만)과 낮은 해상도(224 x 224)를 사용했지만, 본 연구에서는 100만 개 이상의 대규모 고해상도 X-ray 이미지 데이터셋을 활용한다.
제안 모델은 마스크 자동 인코더 프레임워크를 따르며, 이미지 패치를 높은 비율로 마스킹한 후 Transformer 인코더-디코더 네트워크를 통해 마스크된 영역을 복원한다. 특히, 본 연구에서는 새로운 문맥 인식 마스킹 전략을 도입하여 가슴 윤곽선을 활용한 적응형 마스킹 작업을 수행한다.
제안 모델의 효과성을 검증하기 위해 두 가지 다운스트림 작업, 즉 X-ray 보고서 생성과 질병 인식을 수행했다. 실험 결과, 제안 모델은 벤치마크 데이터셋에서 기존 최신 모델과 비교해 동등하거나 더 우수한 성능을 달성했다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Xiao Wang,Yu... um arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.17926.pdfTiefere Fragen