이 연구는 폐 암 아형 분류를 위해 다중 오믹스 데이터와 양자 기계 학습을 통합하는 혁신적인 프레임워크를 제안한다. 데이터는 GDC-TCGA 데이터베이스에서 가져왔으며, DNA 메틸화, RNA-seq, miRNA-seq 데이터를 포함한다.
데이터 전처리 단계에서는 t-test를 사용하여 각 오믹스 데이터에서 유의미한 특징과 비유의미한 특징을 식별하였다. 이후 특징 선택 과정에서는 4가지 기계 학습 기법(MI, Chi-square, PCA, RF)을 적용하여 중요 특징을 선별하고, AUC-ROC 분석과 계층적 클러스터링을 통해 최적의 특징을 선택하였다.
선택된 특징들은 양자 신경망 모델에 입력되어 LUAD와 LUSC 아형을 분류하였다. 256개, 64개, 32개의 특징을 각각 사용한 3가지 모델을 평가한 결과, 256개 특징을 사용한 모델이 가장 우수한 성능을 보였다. 이는 다중 오믹스 데이터와 양자 기계 학습의 통합이 폐 암 아형 분류에 효과적임을 보여준다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문