核心概念
오염된 데이터에서도 강력한 이상 탐지 성능을 보이는 SoftPatch 알고리즘을 제안한다.
摘要
이 논문은 실제 산업 현장에서 발생할 수 있는 오염된 데이터 문제에 초점을 맞추고 있다. 기존의 비지도 이상 탐지 알고리즘들은 깨끗한 학습 데이터를 전제로 하기 때문에, 오염된 데이터가 포함된 경우 성능이 저하된다.
이를 해결하기 위해 SoftPatch 알고리즘을 제안한다. SoftPatch는 패치 단위의 노이즈 식별자를 사용하여 오염된 패치를 제거하고, 남은 패치들의 노이즈 수준을 고려하여 이상 점수를 재가중치화 한다. 이를 통해 오염된 데이터에서도 강력한 이상 탐지 성능을 보인다.
구체적으로 SoftPatch는 다음과 같은 과정을 거친다:
- 패치 단위의 노이즈 식별자(Nearest Neighbor, Gaussian, LOF)를 사용하여 오염된 패치를 식별하고 제거
- 남은 패치들의 노이즈 수준을 메모리 뱅크에 저장
- 테스트 시 패치 단위 이상 점수에 노이즈 수준을 반영하여 이미지 단위 이상 점수 계산
실험 결과, SoftPatch는 기존 방법들에 비해 오염된 데이터 환경에서 월등한 성능을 보였다. 특히 유사한 외관의 이상 샘플이 테스트 세트에 포함된 경우에도 강건한 성능을 보였다.
统计
오염 데이터 비율이 10%일 때, SoftPatch-LOF의 이미지 수준 AUROC는 0.986, 픽셀 수준 AUROC는 0.979이다.
오염 데이터 비율이 10%일 때, PatchCore의 이미지 수준 AUROC는 0.984, 픽셀 수준 AUROC는 0.956이다.
引用
"오염된 데이터에서도 강력한 이상 탐지 성능을 보이는 SoftPatch 알고리즘을 제안한다."
"SoftPatch는 패치 단위의 노이즈 식별자를 사용하여 오염된 패치를 제거하고, 남은 패치들의 노이즈 수준을 고려하여 이상 점수를 재가중치화 한다."