แนวคิดหลัก
視覚言語モデルには有害な社会属性バイアスが存在するが、従来の研究は単一の属性に着目しがちであり、交差属性バイアスの調査は困難であった。本研究では、テキスト生成型ディフュージョンモデルを活用して大規模な交差属性の擬似事例を生成し、それを用いて視覚言語モデルの交差属性バイアスを包括的に調査・軽減する手法を提案する。
บทคัดย่อ
本研究では、視覚言語モデルにおける有害な社会属性バイアスの問題に取り組む。従来の研究は単一の属性(性別や人種など)に着目していたが、複数の属性が交差する「交差属性」によるバイアスの調査は困難であった。
本研究では以下の取り組みを行った:
- テキスト生成型ディフュージョンモデルを活用して、性別、人種、身体的特徴の交差属性を表現した大規模な擬似事例を生成
- 生成した擬似事例を用いて、6つの最新の視覚言語モデルの交差属性バイアスを包括的に調査
- 生成した擬似事例を活用してモデルの軽減を行い、バイアス低減と性能低下のトレードオフを検討
結果、全てのモデルに交差属性バイアスが存在することが明らかになった。特に人種と性別の交差属性に大きなバイアスが見られた。また、擬似事例を用いた学習により、バイアスを大幅に軽減できることを示した。
สถิติ
視覚言語モデルは、特定の人種と性別の組み合わせに強いバイアスを持つ傾向がある。
例えば、人種と性別の交差属性バイアスが最も大きいモデルでは、中東人男性医師の検索結果に大きなバイアスが見られた。
คำพูด
"視覚言語モデルには有害な社会属性バイアスが存在するが、従来の研究は単一の属性に着目しがちであり、交差属性バイアスの調査は困難であった。"
"本研究では、テキスト生成型ディフュージョンモデルを活用して大規模な交差属性の擬似事例を生成し、それを用いて視覚言語モデルの交差属性バイアスを包括的に調査・軽減する手法を提案する。"