Core Concepts
オンラインコミュニティにおける有害コメントの検出方法を提案する。
Abstract
毒性コメントの増加に対応するため、2段階の超低コストマルチモーダル有害行動検出方法が紹介されている。
CLIP-ViTモデルを使用してテキストと画像を埋め込みに変換し、有害な情報を高精度で識別する。
マシンラーニング分類器(SVMやロジスティック回帰)を使用して、システムを迅速にトレーニングし、超低コストで推論を行う。
テキスト情報の豊富なマルチモーダル埋め込みと従来の機械学習分類器を利用することで、99%以上の精度と再現率で有害な情報を検出可能。
新しい有害コンテンツパターンが特定された場合、分類器を素早く微調整してシステムを更新できる。
導入
オンライン社会コミュニティにおける有害または非規範的行動への対処が重要性を増している。
以前の研究では、マルチモダル表現学習に焦点が当てられていなかった。
実験結果
19,190件の有害なツイートからデータセット作成。CLIP-ViT埋め込みと伝統的MLアルゴリズムの組み合わせで高い精度達成。
200枚ずつの通常画像と有害画像から成るデータセット作成。ゼロショット学習で効果的な結果達成。
結論と今後の展望
マルチモーダル有害行動検出システムは高い精度と再現率を達成し、低コスト開発でも優れた結果が得られることが示された。
動画解析能力や音声データ解析への拡張が今後の研究方向として考えられている。
Stats
"この手法は99%以上の精度および再現率を達成します。"
"17,077件の非有害なツイートが含まれます。"