Core Concepts
적대적 예제를 활용하여 컴퓨터 비전 모델의 편향을 완화하고 정확도를 향상시킬 수 있다.
Abstract
이 연구는 컴퓨터 비전 모델의 편향을 완화하고 정확도를 향상시키기 위한 새로운 접근법을 제안한다. 기존의 편향 완화 방법들은 편향된 생성 모델에 의해 생성된 반사실적 예제를 사용하여 추가적인 편향을 초래할 수 있다는 문제점이 있다. 이를 해결하기 위해 저자들은 인간에게는 인지되지 않지만 모델을 속일 수 있는 적대적 예제를 활용하는 방법을 제안한다.
저자들은 이러한 속성 특정적 적대적 예제(ASAC)를 생성하고, 커리큘럼 학습 기반 미세 조정 접근법을 통해 이를 활용한다. 실험 결과, 제안 방법은 기존 방법 대비 편향 지표를 개선하면서도 모델의 전반적인 성능을 유지하거나 향상시킬 수 있음을 보여준다. 또한 시각화 기법을 통해 제안 방법이 모델의 결정에서 민감 속성과의 관계를 효과적으로 분리할 수 있음을 확인하였다.
Stats
제안 방법을 적용한 모델은 미소 분류기에서 기존 모델 대비 DEO 0.058, DEOq 0.045, DDP 0.14로 개선된 성능을 보였다.
큰 코 분류기에서는 DEO 0.354, DEOq 0.267, DDP 0.306으로 개선되었다.
곱슬머리 분류기에서는 DEO 0.344, DEOq 0.228, DDP 0.342로 개선되었다.
Quotes
"우리는 적대적 이미지를 카운터팩추얼로 활용하는 새로운 접근법을 제안한다."
"적대적 이미지를 활용하면 편향된 생성 모델에 의해 생성된 카운터팩추얼로 인해 발생할 수 있는 추가적인 편향을 방지할 수 있다."
"제안 방법은 편향 지표를 개선하면서도 모델의 전반적인 성능을 유지하거나 향상시킬 수 있다."