Core Concepts
ソーシャルメディアにおける攻撃的および憎悪的発言は単純な二分法ではなく、連続的なスペクトルとして存在し、その強度と対象の特定が重要である。
Abstract
本研究は、ソーシャルメディア(Twitterデータ)における攻撃的および憎悪的発言の分析を行った。
データは8,258件のアムハラ語ツイートで、5人の注釈者によって以下の3つの観点から注釈された:
カテゴリー分類(憎悪、攻撃的、通常、不明確)
対象の特定(民族、政治、宗教、ジェンダー、その他)
強度の評価(憎悪と攻撃性のリッカート尺度1-5)
分析の結果、
攻撃的および憎悪的発言は単純な二分法ではなく、連続的なスペクトルとして存在することが明らかになった。
民族と政治的な対象が大半を占め、両者が重複する傾向があり、エチオピアの複雑な社会政治的状況を反映している。
分類モデルとリグレッションモデルを構築し、これらのタスクに対する有効性を検証した。Afro-XLMR-largeモデルが最も良好な性能を示した。
Stats
攻撃的ツイートの69%が「穏やか」、23%が「中程度」、8%が「深刻」なカテゴリーに分類された。
憎悪的ツイートの72%が「早期警告」、17%が「非人間化」、11%が「暴力と扇動」のカテゴリーに分類された。
Quotes
"ソーシャルメディアプラットフォームは憎悪的コンテンツの散布と増幅の主な場所となっている。"
"憎悪的発言は単純な二分法では捉えきれず、連続的なスペクトルとして存在する。"
"民族と政治的な対象が大半を占め、両者が重複する傾向があり、エチオピアの複雑な社会政治的状況を反映している。"