Core Concepts
노이즈 레이블 데이터에서 동료 모델 간 예측 합의도를 이용하여 깨끗한 샘플과 노이즈 샘플을 효과적으로 구분하고, 이를 통해 기존 노이즈 레이블 학습 모델의 성능을 향상시킬 수 있다.
Abstract
이 논문은 노이즈 레이블 문제를 해결하기 위한 새로운 샘플 선택 기법인 PASS(Peer-Agreement based Sample Selection)를 제안한다. PASS는 세 개의 분류기를 활용하여 두 개의 분류기 간 예측 합의도를 기반으로 깨끗한 샘플과 노이즈 샘플을 구분한다.
PASS의 주요 특징은 다음과 같다:
- 기존 손실 기반 또는 특징 기반 샘플 선택 방법의 한계를 극복할 수 있다.
- 다양한 노이즈 레이블 학습 모델(InstanceGM, DivideMix, SSR 등)에 쉽게 통합될 수 있다.
- CIFAR-100, CIFAR-N, Animal-10N, Red mini-ImageNet, Clothing1M, mini-WebVision 등의 벤치마크에서 기존 최신 모델 대비 성능 향상을 보인다.
Stats
노이즈 레이블 데이터에서 동료 모델 간 예측 합의도가 높은 샘플일수록 깨끗한 샘플일 가능성이 높다.
노이즈 레이블 데이터에서 동료 모델 간 예측 합의도가 낮은 샘플일수록 노이즈 샘플일 가능성이 높다.
Quotes
"노이즈 레이블 데이터에서 동료 모델 간 예측 합의도가 높은 샘플일수록 깨끗한 샘플일 가능성이 높다."
"노이즈 레이블 데이터에서 동료 모델 간 예측 합의도가 낮은 샘플일수록 노이즈 샘플일 가능성이 높다."