이 논문은 데이터 편향 문제를 해결하기 위한 방법을 제안한다. 데이터 편향이란 학습 데이터에 특정 클래스와 주변 속성 간의 잘못된 상관관계가 존재하는 것을 의미한다. 이로 인해 모델은 내재적 특징보다 편향 특징에 과도하게 의존하게 되어 편향된 예측을 하게 된다.
제안 방법은 편향-대조 쌍을 활용하여 내재적 특징을 명시적으로 강조한다. 편향-대조 쌍은 편향 특징이 있는 샘플(편향 정렬 샘플)과 편향 특징이 없는 샘플(편향 충돌 샘플)로 구성된다. 이 쌍의 공통 특징 중 클래스 구분에 도움이 되는 특징을 내재적 특징으로 간주한다. 그리고 이 내재적 특징 중에서도 편향 정렬 샘플에서 상대적으로 활용되지 않은 부분을 강조하는 가중치를 계산한다. 이 가중치를 통해 모델에 내재적 특징에 집중하도록 명시적인 공간적 지침을 제공한다.
편향 정보가 없는 상황에서 편향-대조 쌍을 구성하기 위해, 편향 점수를 도입하여 편향 충돌 샘플을 선별한다. 편향 점수는 편향 모델의 손실 변화를 추적하여 편향 특징이 강한 샘플을 식별한다.
실험 결과, 제안 방법은 다양한 편향 수준의 합성 및 실제 데이터셋에서 최신 성능을 달성했다. 또한 시각화 분석을 통해 제안 방법이 모델이 내재적 특징에 집중하도록 유도함을 확인했다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문