Concepts de base
AI 생성 모델이 생성한 이미지를 향후 모델 학습에 사용하면 편향성이 증폭될 수 있는지 탐구한다.
Résumé
이 연구는 AI 생성 모델이 생성한 이미지를 점진적으로 기존 데이터셋에 대체하여 학습한 모델의 편향성 변화를 분석한다.
실험 결과:
- 일부 경우에는 편향성이 증폭되지만, 다른 경우에는 감소하는 등 일관된 경향을 보이지 않음
- 이는 기존 데이터셋의 편향성과 Stable Diffusion의 생성 한계(예: 흐릿한 얼굴) 때문으로 추정
따라서 AI 생성 이미지가 향후 모델의 편향성에 미치는 영향은 복잡하며, 데이터셋 구성과 생성 모델의 특성에 따라 다양한 결과가 나타날 수 있음을 시사한다.
Stats
실험에 사용된 데이터셋은 COCO와 CC3M으로, 약 300만 개의 이미지-텍스트 쌍으로 구성됨.
원본 데이터셋에 비해 CLIP 모델의 성능이 낮게 나타났는데, 이는 학습 데이터 규모의 차이 때문으로 보임.
Citations
"우리의 실험 결과는 현재의 생성 모델에서 생성된 이미지를 사용하는 것이 편향성을 일관되게 증폭시키지는 않는다는 것을 보여준다."
"편향성 증폭 및 완화의 다양한 양상은 기존 데이터셋의 편향성과 Stable Diffusion의 생성 한계 등 여러 요인이 복합적으로 작용한 결과로 추정된다."