Główne pojęcia
고해상도 X-ray 이미지를 활용한 마스크 자동 인코더 기반 사전 학습 모델을 제안하며, 이를 통해 의료 보고서 생성 및 질병 예측 등의 다운스트림 작업에서 우수한 성능을 달성할 수 있음을 보여줌.
Streszczenie
본 연구에서는 고해상도(1280 x 1280) X-ray 이미지 기반 사전 학습 모델을 제안한다. 기존 X-ray 기반 사전 학습 모델들은 상대적으로 작은 규모의 데이터셋(50만 개 미만)과 낮은 해상도(224 x 224)를 사용했지만, 본 연구에서는 100만 개 이상의 대규모 고해상도 X-ray 이미지 데이터셋을 활용한다.
제안 모델은 마스크 자동 인코더 프레임워크를 따르며, 이미지 패치를 높은 비율로 마스킹한 후 Transformer 인코더-디코더 네트워크를 통해 마스크된 영역을 복원한다. 특히, 본 연구에서는 새로운 문맥 인식 마스킹 전략을 도입하여 가슴 윤곽선을 활용한 적응형 마스킹 작업을 수행한다.
제안 모델의 효과성을 검증하기 위해 두 가지 다운스트림 작업, 즉 X-ray 보고서 생성과 질병 인식을 수행했다. 실험 결과, 제안 모델은 벤치마크 데이터셋에서 기존 최신 모델과 비교해 동등하거나 더 우수한 성능을 달성했다.
Statystyki
본 연구에서 사용한 X-ray 이미지 데이터셋은 약 100만 개의 고해상도(1280 x 1280) 이미지로 구성되어 있다.
의료 보고서 생성 작업에 사용된 PCC-Xray 데이터셋은 200,172개의 고해상도 X-ray 이미지와 대응되는 중국어 의료 보고서로 구성되어 있다.
질병 인식 작업에 사용된 RSNA-Pneumonia 데이터셋은 30,000개의 정면 흉부 X-ray 영상으로 구성되어 있다.
Cytaty
"기존 X-ray 기반 사전 학습 모델들은 상대적으로 작은 규모의 데이터셋(50만 개 미만)과 낮은 해상도(224 x 224)를 사용했지만, 본 연구에서는 100만 개 이상의 대규모 고해상도 X-ray 이미지 데이터셋을 활용한다."
"제안 모델은 마스크 자동 인코더 프레임워크를 따르며, 이미지 패치를 높은 비율로 마스킹한 후 Transformer 인코더-디코더 네트워크를 통해 마스크된 영역을 복원한다."
"본 연구에서는 새로운 문맥 인식 마스킹 전략을 도입하여 가슴 윤곽선을 활용한 적응형 마스킹 작업을 수행한다."