核心概念
트리 기반 앙상블 학습 모델을 이용하여 학습 데이터와 다른 분포의 테스트 데이터를 효과적으로 탐지할 수 있다.
摘要
이 논문에서는 TOOD(Tree-based Out-of-distribution Detection) 방법을 제안한다. TOOD는 트리 기반 앙상블 학습 모델을 이용하여 학습 데이터와 다른 분포의 테스트 데이터를 탐지하는 방법이다.
TOOD의 주요 특징은 다음과 같다:
- 해석 가능성: 트리 기반 모델이므로 모델의 작동 원리를 쉽게 이해할 수 있다.
- 강건성: 트리 기반 모델이 퍼터베이션에 강건하다.
- 효율성: 신경망 모델에 비해 학습과 추론이 빠르다.
- 유연성: 다양한 기계 학습 문제에 적용할 수 있으며, 지도 학습뿐만 아니라 비지도 학습에도 확장할 수 있다.
TOOD는 테스트 데이터의 트리 임베딩 간 평균 해밍 거리(APHD)를 계산하여 분포 외 데이터를 탐지한다. 이론적 분석을 통해 APHD가 분포 내 데이터와 분포 외 데이터를 잘 구분할 수 있음을 보였다.
다양한 실험 결과, TOOD는 기존 방법들과 비교하여 우수한 성능을 보였다. 특히 이미지, 텍스트 데이터에서 두드러진 성능 향상을 보였다. 또한 TOOD는 적대적 공격에 강건하며, 지도 학습뿐만 아니라 비지도 학습에도 적용할 수 있다.
統計資料
분포 내 데이터와 분포 외 데이터의 APHD 값이 크게 차이난다.
분포 내 데이터의 APHD 값은 대부분 1에 가깝다.
분포 외 데이터의 APHD 값은 0에 가깝다.
引述
"트리 기반 앙상블 학습 모델을 이용하여 학습 데이터와 다른 분포의 테스트 데이터를 효과적으로 탐지할 수 있다."
"TOOD는 해석 가능성, 강건성, 효율성, 유연성 등의 장점을 가진다."
"TOOD는 다양한 실험 결과에서 기존 방법들과 비교하여 우수한 성능을 보였다."