本研究は、オンラインの宗派間暴力の自動検出に取り組んでいる。まず、宗教的、民族的、非宗教的な暴力の4つのカテゴリーと、抑圧、偏見、敵意、侮辱の4つの表現形式を定義した包括的な理論的フレームワークを提案した。次に、この枠組みに基づいて、ソーシャルメディアからバングラ語のコンテンツを収集し、専門家による7段階の注釈プロセスを経て、13,000件を超える大規模なデータセットを構築した。データ分析の結果、宗教的宗派間暴力が特に顕著であることが明らかになった。また、最先端のバングラ語深層学習モデルを使った予備的ベンチマーキングを行い、この課題の計算上の難しさを示した。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문