本論文は、分散型かつ相互運用可能なソーシャルネットワーク(フェディバース)におけるコンテンツモデレーションの課題を分析し、解決策を提案している。
まず、Pleroma(大規模な分散型マイクロブログサービス)のデータを用いて、フェディバースにおける会話の特徴を分析した。その結果、インスタンス間で会話が断片化されることが明らかになった。これは、相互運用性により会話がフェデレーションされる際に、各インスタンスが会話の一部しか見ることができないためである。
次に、この会話の断片化が、コンテンツモデレーションに及ぼす影響を検討した。会話の文脈情報を活用するGraphNLIモデルを用いて、大規模・中規模インスタンスでは高精度にトキシックコンテンツを検出できることを示した(マクロF1スコア0.8837)。一方、小規模インスタンスでは性能が低下した。
そこで、インスタンス間で情報(投稿やモデルパラメータ)を共有する戦略を提案した。その結果、小規模インスタンスでもマクロF1スコア0.8826と高精度にトキシックコンテンツを検出できるようになった。
本研究は、分散型かつ相互運用可能なソーシャルネットワークにおけるコンテンツモデレーションの課題と解決策を示したものであり、フェディバースやその他の分散型プラットフォームにおけるモデレーション改善に寄与すると考えられる。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問