이 논문은 데이터 스트림에서 의사결정 트리 학습을 위한 최적 분할점을 찾는 알고리즘을 제안한다.
회귀 문제의 경우, 관찰값 xi와 라벨 yi로 구성된 데이터 스트림이 주어졌을 때, 평균 제곱 오차를 최소화하는 최적 분할점 j를 찾는다. 이를 위해 다음과 같은 알고리즘을 제시한다:
분류 문제의 경우, 관찰값 xi와 이진 라벨 yi로 구성된 데이터 스트림이 주어졌을 때, 오분류율을 최소화하는 최적 분할점 j를 찾는다. 이를 위해 다음과 같은 알고리즘을 제시한다:
또한 범주형 관찰값에 대한 분류 문제도 다룬다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Huy Pham,Hoa... alle arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19867.pdfDomande più approfondite