本研究では、オンラインコミュニティにおける性差別の程度を定量的に測定するための包括的な指標を提案している。
まず、監督付きの自然言語処理モデルを使って、各コメントの攻撃性を検出する。次に、単語の出現頻度と単語の男女バイアスを組み合わせて、各単語の「攻撃性」を算出する。これらの指標を用いて、各コミュニティにおける男性アイデンティティと女性アイデンティティに対する攻撃性を定量化する。
さらに、男性個人と女性個人に対する攻撃性も別途定量化することで、性差別の対象が集団アイデンティティなのか個人なのかを区別できるようにしている。
提案手法を14のサブレディットに適用した結果、既存研究で指摘されていた性差別的なコミュニティの特徴を定量的に確認できた。また、これまで分析されていなかったコミュニティについても、男女に対する攻撃性の程度を明らかにできた。
本手法は、オンラインコミュニティの性差別の程度を包括的に測定し、経時的な変化を追跡したり、コミュニティ間の比較を行ったりするのに役立つ。また、本手法は性差別以外の偏向性の定量化にも応用できる可能性がある。
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Vahid Ghafou... klokken arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02205.pdfDypere Spørsmål