본 연구에서는 은행 데이터 이상치 탐지를 위해 Isolation Forest, One-class SVM, Gaussian Mixture Model 등 3가지 이상치 탐지 모델을 활용하였다. 이상치 탐지 모델의 예측 결과를 설명하기 위해 Anchors와 DTOR(Decision Tree Outlier Regressor) 기법을 적용하였다.
DTOR는 이상치 점수 추정을 위해 가중치가 부여된 의사결정나무 회귀 모델을 활용한다. 이를 통해 개별 데이터 포인트의 이상치 점수를 정확하게 추정하고, 해당 데이터 포인트의 경로를 추출하여 해석 가능한 규칙을 생성한다.
실험 결과, DTOR는 Anchors 대비 실행 시간이 빠르고, 규칙의 정확도와 적용 범위 측면에서 유사하거나 우수한 성능을 보였다. 특히 Isolation Forest 모델에 대해 DTOR가 더 나은 성능을 보였는데, 이는 DTOR의 접근 방식이 Isolation Forest의 이상치 분리 원리와 부합하기 때문으로 판단된다.
DTOR는 이상치 탐지 모델의 예측 결과를 해석 가능한 규칙으로 설명함으로써, 데이터 과학자와 도메인 전문가 간의 협업과 신뢰 향상에 기여할 것으로 기대된다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Riccardo Cru... kl. arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.10903.pdfDybere Forespørgsler