Conceitos Básicos
결측 데이터가 있는 상황에서 예측 규칙 앙상블(PRE) 모델의 성능을 향상하기 위해 다양한 데이터 대치 방법과 변수 조정 기법을 비교 분석하고, 실제 데이터 분석에서 적절한 방법을 선택하는 데 필요한 정보를 제공합니다.
Resumo
결측 데이터가 있는 경우 해석 가능한 예측 규칙 앙상블: 다양한 결측값 처리 방법 비교
본 연구는 예측 분석에 유 promising한 기법인 예측 규칙 앙상블(PRE)의 성능을 결측 데이터가 있는 상황에서 평가하고, 다중 대치법을 사용하여 결측값을 처리할 때 발생하는 문제점을 해결하기 위한 효과적인 방법을 제시하는 것을 목표로 합니다.
시뮬레이션 연구를 통해 다양한 결측 데이터 처리 방법(listwise deletion, MICE PMM, MICE RF, missRanger, MIXGBoost)을 적용한 PRE 모델의 성능을 비교 분석했습니다. 결측 데이터 메커니즘(MCAR, MAR), 표본 크기(N = 200, N = 400), 결측 비율(8%, 48%)을 변화시키면서 1,000번의 반복 시뮬레이션을 수행했습니다. 또한, 변수 조정(coarsening) 기법을 적용하여 모델의 복잡성을 줄이고 해석력을 향상하는 효과를 평가했습니다.