이 논문은 데이터 스트림에서 의사결정 트리 학습을 위한 최적 분할점을 찾는 알고리즘을 제안한다.
회귀 문제의 경우, 관찰값 xi와 라벨 yi로 구성된 데이터 스트림이 주어졌을 때, 평균 제곱 오차를 최소화하는 최적 분할점 j를 찾는다. 이를 위해 다음과 같은 알고리즘을 제시한다:
분류 문제의 경우, 관찰값 xi와 이진 라벨 yi로 구성된 데이터 스트림이 주어졌을 때, 오분류율을 최소화하는 최적 분할점 j를 찾는다. 이를 위해 다음과 같은 알고리즘을 제시한다:
또한 범주형 관찰값에 대한 분류 문제도 다룬다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Huy Pham,Hoa... om arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19867.pdfDiepere vragen