해석 가능한 비지도 트리 앙상블을 위한 특징 그래프: 중심성, 상호작용 및 질병 아형 분류에의 적용
비지도 학습에서 특징 선택은 모델의 해석 가능성을 높이는 데 핵심적인 역할을 한다. 이 연구는 비지도 랜덤 포레스트에서 특징 그래프를 구축하고 이를 활용하여 특징 선택 전략을 제안한다. 특징 그래프는 트리 내 부모-자식 노드 분할을 활용하여 구축되며, 특징의 중심성은 클러스터링 작업에서의 관련성을, 엣지 가중치는 특징 쌍의 판별력을 반영한다. 제안된 그래프 기반 특징 선택 방법은 합성 데이터와 벤치마크 데이터에서 차원 축소와 모델 해석 가능성 향상에 효과적임을 보여준다. 또한 유전체 데이터를 활용한 질병 아형 분류 사례에서 각 클러스터에 대한 핵심 특징을 식별하여 제안 방법의 실용성을 입증한다.