المفاهيم الأساسية
본 논문은 의료 데이터 부족 문제를 해결하기 위해 제한된 데이터 환경에서 암 관련 의료 초록을 효과적으로 분류하는 그래프 기반 잔차 네트워크(R-GAT) 모델을 제안하고, 이 모델의 우수성을 기존 머신러닝 및 딥러닝 모델과 비교 분석합니다.
الملخص
의료 초록 분류를 위한 R-GAT 모델 제안
본 논문에서는 갑상선암, 대장암, 폐암 및 일반 주제와 관련된 1,874개의 의료 초록 데이터 세트를 사용하여 제한된 데이터 환경에서 암 관련 문서 분류 성능을 향상시키는 데 초점을 맞춘 연구를 수행했습니다.
갑상선암, 대장암, 폐암 관련 의료 초록 데이터 부족 현상을 해결하고, 이를 분류하는 효과적인 모델을 개발합니다.
제한된 데이터 환경에서 그래프 기반 잔차 네트워크(R-GAT) 모델이 기존 머신러닝 및 딥러닝 모델보다 우수한 성능을 보이는지 검증합니다.
데이터 수집 및 준비: PubMed에서 갑상선암, 대장암, 폐암, 일반 주제 관련 의료 초록 1,874개를 수집하고, 토큰화, 정규화, 클래스 불균형 처리 등의 전처리를 수행했습니다.
R-GAT 모델 개발: 그래프 기반 잔차 네트워크(R-GAT) 모델을 설계하고, 의료 초록 데이터의 특성을 반영한 그래프 구축, 주의 메커니즘 기반 그래프 레이어, 잔차 블록 등을 구현했습니다.
모델 학습 및 평가: 5-fold 교차 검증을 통해 R-GAT 모델을 학습하고, 정확도, 정밀도, 재현율, F1 점수를 사용하여 성능을 평가했습니다.
비교 분석: 기존 머신러닝 모델(Decision Tree, Random Forest, Logistic Regression 등), 딥러닝 모델(CNN, RNN, LSTM, BioBERT 등)과 R-GAT 모델의 성능을 비교 분석했습니다.