Centrala begrepp
이 논문은 베이지안 추론 접근법을 사용하여 결정 트리 예측의 불확실성을 정량화하는 방법을 제안한다. 이를 위해 각 고유한 트리 구조에 대해 고유한 의사 결정 매개변수 집합을 사용하는 DCC-Tree 알고리즘을 소개한다.
Sammanfattning
이 논문은 베이지안 결정 트리 모델의 불확실성을 정량화하는 방법을 제안한다. 기존의 마르코프 체인 몬테카를로(MCMC) 방법은 트리 구조와 의사 결정 매개변수 간의 강한 결합으로 인해 효율적인 샘플링에 어려움이 있었다. 이 논문에서는 각 고유한 트리 구조에 대해 고유한 의사 결정 매개변수 집합을 사용하는 DCC-Tree 알고리즘을 제안한다.
DCC-Tree 알고리즘은 다음과 같이 진행된다:
트리 구조에 따라 목표 분포를 분할한다.
각 트리 구조에 대해 로컬 추론을 수행하여 샘플을 생성한다.
각 로컬 샘플을 해당 트리 구조의 주변 가능도를 기반으로 결합한다.
이를 통해 기존 MCMC 기반 방법보다 효율적인 샘플링이 가능하며, 계산 오버헤드도 감소시킬 수 있다. 실험 결과 DCC-Tree 알고리즘이 다른 베이지안 결정 트리 방법과 비교하여 성능이 유사하거나 더 우수한 것으로 나타났다.
Statistik
데이터셋의 입력 차원은 nx이고, 출력 차원은 ny=1이다.
데이터셋 D는 N개의 입력-출력 쌍 (xi, yi)로 구성된다.