Core Concepts
노이즈 환경에서 도메인 적응 시 발생하는 유사 클래스 간 혼란을 해결하기 위해 프로토타입 기반 혼란 쌍 교정 방법을 제안한다.
Abstract
이 논문은 노이즈 환경에서의 도메인 적응 문제를 다룬다. 기존 방법들은 노이즈 레이블로 인한 모델의 과적합 문제와 유사 클래스 간 혼란 문제를 해결하지 못했다.
저자들은 이를 해결하기 위해 다음과 같은 방법을 제안한다:
프로토타입 기반 타깃 도메인 정제:
소스 도메인과 타깃 도메인의 프로토타입을 정렬하여 타깃 도메인의 의사 레이블을 생성한다.
프로토타입으로부터 멀리 떨어진 샘플을 제거하여 분류 경계를 명확히 한다.
혼란 쌍 교정:
쉬운 클래스와 어려운 클래스를 구분한다.
어려운 클래스 내에서 가장 혼란스러운 쌍을 찾아 노이즈 샘플의 레이블을 교정한다.
이를 통해 모델은 더 정확한 의사 레이블로 학습할 수 있게 된다. 실험 결과 제안 방법이 기존 최신 기법들을 능가하는 성능을 보였다.
Stats
각 클래스의 평균 손실이 임계값 ζ 보다 작은 클래스는 쉬운 클래스로 간주된다.
타깃 샘플의 상위 2개 예측 결과의 빈도를 계산하여 가장 혼란스러운 쌍 α*, β*를 찾는다.
Quotes
"노이즈 레이블로 인해 모델이 과적합되어 전체적인 모델 성능이 크게 저하된다."
"유사한 특징을 가진 두 클래스를 효과적으로 분류하는 것이 어렵다."