核心概念
STOPHCは、ディープニューラルネットワークとネットワーク免疫化アルゴリズムを用いて、ソーシャルメディア上の有害コンテンツを効果的に検出し、その拡散を抑制するアーキテクチャである。
書誌情報
Truicǎ, C.-O., Constantinescu, A.-T., & Apostol, E.-S. (2024). STOPHC: A Harmful Content Detection and Mitigation Architecture for Social Media Platforms. arXiv preprint arXiv:2411.06138v1.
研究目的
本研究は、ソーシャルメディアプラットフォームにおける有害コンテンツの検出と抑制を目的とした新しいアーキテクチャ、STOPHCを提案するものである。
方法論
STOPHCは、有害コンテンツ検出モジュールとネットワーク免疫化モジュールの2つの主要モジュールで構成されている。検出モジュールでは、Word2Vec、GloVe、BERT、RoBERTaなどの埋め込み技術を用いてテキストデータから有害コンテンツを識別するディープニューラルネットワークモデルを採用している。ネットワーク免疫化モジュールは、ユーザーインタラクションに基づいてネットワークグラフを構築し、有害コンテンツの拡散を阻止するためにHighest Degree、NetShield、DAVAなどの免疫化戦略を採用している。
主な結果
2つの実世界のデータセットを用いた実験の結果、STOPHCは有害コンテンツを効果的に検出し、その拡散を抑制できることが示された。提案されたディープラーニングモデルは、有害コンテンツの分類において優れたパフォーマンスを示し、ネットワーク免疫化技術は、オンラインでの有害コンテンツの拡散を抑制する上で有効であることが証明された。
結論
STOPHCは、ソーシャルメディアプラットフォームにおける有害コンテンツの検出と抑制のための有望なアーキテクチャである。本研究で提案されたディープラーニングモデルとネットワーク免疫化戦略は、オンライン環境の安全性を向上させるための効果的なツールとなる可能性がある。
意義
本研究は、ソーシャルメディア上の有害コンテンツに対処するための新しいアプローチを提供するものであり、オンラインの安全とユーザーのウェルビーイングの向上に貢献するものである。
限界と今後の研究
今後の研究では、より洗練されたネットワーク免疫化アルゴリズムの探求、リアルタイムの有害コンテンツ検出と抑制のためのアーキテクチャの最適化、STOPHCの多言語ソーシャルメディアプラットフォームへの適応などが考えられる。
統計
EXIST2023データセットは、有害/非有害として分類された3,258件の英語ツイートと、ネットワーク情報を提供する。
Hate Speechデータセットには、33,458件のヘイトスピーチと攻撃的なツイートが含まれており、有害と非有害の2つのクラスに分類される。
ネットワーク免疫化実験では、DAVAは局所的な拡散の処理に特化しているため、より多くのノードを免疫化することに成功した。