이 논문은 이진 분류기의 편향성을 분석하고 해결하는 방법을 제안한다.
먼저, 기존의 카테고리 분류기 시각화 기법을 이진 분류기에 적용할 수 있도록 확장한다. 이를 통해 이진 분류기가 어떤 입력 영역에 집중하는지 확인할 수 있다.
실험에서는 CelebA 데이터셋의 40개 얼굴 속성을 분류하는 두 가지 모델을 비교한다. 첫 번째 모델은 데이터 불균형을 고려하지 않고 학습된 AFFACT-u 모델이다. 이 모델은 다수 클래스에 대해서는 매우 정확한 예측을 하지만, 시각화 결과 다수 클래스 예측은 편향된 특징에 의존하는 것으로 나타났다. 반면 소수 클래스 예측은 합리적인 영역에 집중하는 것으로 나타났다.
두 번째 모델은 데이터 불균형을 해결하기 위해 가중치를 적용하여 학습된 AFFACT-b 모델이다. 이 모델은 다수 및 소수 클래스에 대해 균형 잡힌 성능을 보였으며, 시각화 결과에서도 합리적인 특징 추출이 확인되었다.
이 연구 결과는 편향된 이진 분류기의 문제점을 보여주며, 데이터 불균형 해결을 통해 보다 해석 가능한 모델을 학습할 수 있음을 시사한다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询