Core Concepts
노이즈 레이블 학습을 위해 두 가지 스트림 샘플 증류 방법을 제안한다. 이 방법은 특징 공간과 손실 공간의 정보를 함께 고려하여 더 많은 고품질 샘플을 추출하여 네트워크 학습을 강화한다.
Abstract
이 논문은 노이즈 레이블 학습을 위한 새로운 방법인 Two-Stream Sample Distillation(TSSD)을 제안한다. TSSD는 두 가지 모듈로 구성되어 있다:
- Parallel Sample Division (PSD) 모듈:
- 특징 공간과 손실 공간의 정보를 함께 고려하여 학습 데이터를 확실한 집합과 불확실한 집합으로 나눈다.
- 확실한 집합에는 신뢰할 수 있는 긍정 샘플과 부정 샘플이 포함된다.
- 불확실한 집합에는 반확실 샘플이 포함된다.
- Meta Sample Purification (MSP) 모듈:
- 확실한 집합의 긍정 샘플과 부정 샘플을 메타 데이터로 사용하여 메타 분류기를 학습한다.
- 메타 분류기를 사용하여 불확실한 집합에서 추가적인 긍정 샘플을 찾아낸다.
이를 통해 반복적으로 더 많은 고품질 샘플을 추출하여 네트워크를 강건하게 학습할 수 있다. 실험 결과 TSSD가 다양한 벤치마크 데이터셋에서 최신 기술 대비 우수한 성능을 보였다.
Stats
노이즈 레이블이 20%인 CIFAR-10 데이터셋에서 TSSD의 정확도는 96.7%이다.
노이즈 레이블이 50%인 CIFAR-100 데이터셋에서 TSSD의 정확도는 78.1%이다.
노이즈 레이블이 20%인 Tiny-ImageNet 데이터셋에서 TSSD의 정확도는 60.9%이다.
Clothing-1M 데이터셋에서 TSSD의 정확도는 75.6%이다.
Quotes
"노이즈 레이블 학습은 노이즈 레이블이 있는 환경에서 강건한 네트워크를 학습하는 것을 목표로 한다."
"기존 연구는 샘플 선택 또는 레이블 수정 방법을 사용하여 노이즈 레이블 문제를 해결한다."
"우리는 특징 공간과 손실 공간의 정보를 함께 고려하여 더 많은 고품질 샘플을 추출할 수 있는 TSSD 방법을 제안한다."