이 논문은 데이터 편향 문제를 해결하기 위한 새로운 접근법인 Bam(Bias Amplification)을 제안한다. Bam은 두 단계로 구성된다:
편향 증폭 단계: 각 학습 데이터에 대한 학습 가능한 보조 변수를 도입하여 모델을 학습한다. 이를 통해 모델이 쉽게 학습할 수 있는 예제에 더 큰 편향을 가지게 된다.
재균형 학습 단계: 첫 번째 단계에서 잘못 분류된 예제에 가중치를 부여하여 동일한 모델을 계속 학습시킨다.
실험 결과, Bam은 기존 방법들과 비교하여 다양한 벤치마크 데이터셋에서 소수 그룹의 성능을 크게 향상시켰다. 또한 Bam은 그룹 레이블이 없는 상황에서도 효과적으로 작동하는 것으로 나타났다.
추가 분석을 통해 보조 변수가 편향 증폭에 효과적이며, 클래스 정확도 차이를 최소화하는 것이 그룹 정확도를 최대화하는 데 유용한 지표임을 확인하였다. 또한 첫 번째 단계의 편향된 모델을 재사용하는 것이 새로운 모델을 학습하는 것보다 효과적임을 보였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문