Основні поняття
本研究は、バングラ語オンラインコンテンツにおける宗派間暴力の自動検出のための包括的なフレームワークを開発し、13,000件を超える大規模なデータセットを構築した。
Анотація
本研究は、オンラインの宗派間暴力の自動検出に取り組んでいる。まず、宗教的、民族的、非宗教的な暴力の4つのカテゴリーと、抑圧、偏見、敵意、侮辱の4つの表現形式を定義した包括的な理論的フレームワークを提案した。次に、この枠組みに基づいて、ソーシャルメディアからバングラ語のコンテンツを収集し、専門家による7段階の注釈プロセスを経て、13,000件を超える大規模なデータセットを構築した。データ分析の結果、宗教的宗派間暴力が特に顕著であることが明らかになった。また、最先端のバングラ語深層学習モデルを使った予備的ベンチマーキングを行い、この課題の計算上の難しさを示した。
Статистика
宗教的宗派間暴力は特に広範に見られる。
非宗教的宗派間暴力と民族的宗派間暴力のサンプル数が少ない。
暴力的表現の中では侮辱が最も多く見られる。
Цитати
"オンラインの暴力は、威嚇、偏見、敵意、侮辱など、さまざまな形態をとることができる。"
"宗派間の暴力は、南アジア地域で長年にわたる問題であり、デジタルの広がりと資源の乏しさによってさらに悪化している。"
"バングラ語オンラインコンテンツの自動監視と警告システムを構築する緊急の必要性がある。"