이 논문은 데이터 스트림에서 의사결정 트리 학습을 위한 최적 분할점을 찾는 알고리즘을 제안한다.
회귀 문제의 경우, 관찰값 xi와 라벨 yi로 구성된 데이터 스트림이 주어졌을 때, 평균 제곱 오차를 최소화하는 최적 분할점 j를 찾는다. 이를 위해 다음과 같은 알고리즘을 제시한다:
분류 문제의 경우, 관찰값 xi와 이진 라벨 yi로 구성된 데이터 스트림이 주어졌을 때, 오분류율을 최소화하는 최적 분할점 j를 찾는다. 이를 위해 다음과 같은 알고리즘을 제시한다:
또한 범주형 관찰값에 대한 분류 문제도 다룬다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Huy Pham,Hoa... um arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19867.pdfTiefere Fragen