Core Concepts
본 연구는 텍스트-이미지 확산 모델에서 교차 주의 맵을 편집하여 단일 및 교차 편향을 효과적으로 완화하는 방법을 제안한다.
Abstract
본 연구는 텍스트-이미지 확산 모델에서 발생하는 편향 문제를 해결하기 위해 교차 주의 맵을 편집하는 새로운 방법을 제안한다.
기존 연구들은 특정 편향(예: 성별, 인종)을 개별적으로 다루었지만, 본 연구는 교차 편향(예: 성별과 인종의 교차)을 동시에 해결할 수 있는 방법을 제안한다.
제안 방법은 텍스트 임베딩의 구조적 특성을 활용하여 교차 주의 맵을 개별적으로 편집함으로써, 관련 개념들의 품질을 유지하면서 편향을 완화할 수 있다.
정성적, 정량적 실험을 통해 제안 방법이 기존 접근법들보다 단일 및 교차 편향 완화 성능이 우수함을 입증한다.
편향 완화된 모델과 소스 코드를 공개하여 공정성 있는 생성 모델 개발을 지원한다.
Stats
성별과 인종이 교차된 소방관 이미지에서 Stable Diffusion은 편향된 결과를 보이지만, MIST는 균형 잡힌 결과를 생성한다.
성별, 인종, 나이가 교차된 소방관 이미지에서 Stable Diffusion은 편향된 결과를 보이지만, MIST는 균형 잡힌 결과를 생성한다.
Quotes
"교차 편향은 여러 사회적 정체성이 교차하는 개인이 겪는 고유한 형태의 편향을 의미한다. 교차 편향을 해결하는 것은 중요하다. 이는 인종, 성별 등 다양한 정체성에 기반한 차별의 부정적 영향을 증폭시키기 때문이다."
"본 연구는 텍스트-이미지 확산 모델의 교차 주의 맵을 개별적으로 편집하여 단일 및 교차 편향을 효과적으로 완화하는 새로운 방법을 제안한다."