核心概念
本稿では、オンライン上の有害性を体系的に分類し、マルチモーダル大規模言語モデル(MLLM)を用いて、YouTube動画における有害コンテンツを効果的に検出できる可能性を示唆している。
要約
オンライン上の有害性の分類と有害動画検出におけるMLLMの有効性
本稿は、オンライン上の有害コンテンツ、特にYouTube動画における有害性を検出するための新たな枠組みを提案する研究論文である。
オンライン上の有害コンテンツに対する包括的な分類を確立する。
マルチモーダル大規模言語モデル(MLLM)が、有害動画の検出において、人間の注釈者に代わる信頼性の高い手段となり得るかを検証する。
既存の有害性に関する分類とプラットフォームのコミュニティガイドラインを統合し、6つのカテゴリ(情報、ヘイトと嫌がらせ、依存性、クリックベイト、性的、身体的)から成るオンライン上の有害性に関する包括的な分類を開発した。
19,422本のYouTube動画を収集し、テキストメタデータ(タイトル、チャンネル名、説明文、トランスクリプト)と画像データ(14フレームと1つのサムネイル)を抽出した。
収集したデータを用いて、クラウドワーカー(MTurk)、GPT-4-Turbo、ドメインエキスパートによる3つのアノテーションを実施した。
ドメインエキスパートによるアノテーションをゴールドスタンダードとして、GPT-4-Turboとクラウドワーカーの精度を比較分析した。