Основні поняття
英語ヘイトスピーチデータセットにおいて、投稿者と注釈者の文化的背景の違いが、ヘイトスピーチの判断に大きな影響を与えることが明らかになった。
Анотація
本研究では、英語ヘイトスピーチデータセット「CREHate」を構築し、5つの英語話者国(オーストラリア、イギリス、シンガポール、アメリカ、南アフリカ)の注釈者による投稿のヘイトスピーチ判断を分析した。
データセット構築の2段階:
文化的投稿収集 - 各国の特徴的なキーワードを用いて、4カ国(オーストラリア、イギリス、シンガポール、南アフリカ)から600件の投稿を収集。また、主にアメリカ寄りの投稿が多いSBICデータセットから980件を抽出。
文化横断的注釈 - 各国から5人ずつの注釈者が全投稿にラベルを付与。
分析の結果:
全投稿の56.2%しか全国で一致した判断を得られず、国間の平均ラベル一致率は78.8%にとどまった。
国間のラベル一致率は、文化的に近い国ほど高く、文化的に遠い国ほど低かった。
注釈者の文化的背景による判断の違いは統計的に有意であり、特に皮肉や個人的な偏見が大きな要因と分かった。
大言語モデルの分析では、アングロサクソン圏の国のラベルに対する精度が高く、文化特有のヘイトスピーチ判断には限界があることが示された。
本研究の成果は、ヘイトスピーチ検出における文化的バイアスの問題を明らかにし、より包括的で文化的に敏感なデータセットと手法の必要性を示唆している。
Статистика
ヘイトスピーチ投稿の56.2%しか全国で一致した判断を得られなかった。
国間の平均ラベル一致率は78.8%にとどまった。
最大の国間ラベル不一致率は26.0%であった。
Цитати
"Only 56.2% of the posts in CREHate achieve consensus among all countries, with the highest pairwise label difference rate of 26%."
"Qualitative analysis shows that label disagreement occurs mostly due to different interpretations of sarcasm and the personal bias of annotators on divisive topics."