核心概念
大規模なニュース記事コーパスから、メディアストームと呼ばれる短期的な注目の高まりを自動的に検出する手法を提案する。
要約
本研究では、大規模なニュース記事コーパスからメディアストームを自動的に検出する手法を提案している。メディアストームとは、特定の出来事や問題に対する短期的な集中的な報道のことを指す。
手法の概要は以下の通り:
- 記事の分散を表す4つの信号を生成する(エンティティ、トピック、ナラティブ要素、言語モデル)
- 異常検知モデルを用いて、これらの信号における異常な収束期間を検出する
- 人手による検証を経て、真のメディアストームを特定する
2つの実験設定を行い、1996年から2016年の期間について、合計221件のメディアストームを検出した。検出されたストームには、ハリケーンカトリーナ、ニュートンスクール銃乱射事件、スノーデンのNSA暴露など、重要なニュースイベントが含まれていた。
本手法は、大規模なニュースコーパスからメディアストームを自動的に検出する効果的な方法を示している。検出されたストームのデータセットは、メディア動態の理解や予測に役立つと考えられる。
統計
2003年には、イラク戦争の報道に関連して、190日間にわたるメディアストームが観察された。
1996年から2006年の期間の年間平均ストーム数は9.18件であったのに対し、2007年から2016年の期間は年間平均12件と有意に増加していた。
引用
"メディアストームは、メディア動態の中心的な要素であり、ほぼすべてのメディア関連の効果を強化する。"
"メディアストームの概念を具体的に測定可能な対象として操作化することは明確ではない。"