核心概念
絵文字の説明から感情分析用辞書を自動生成する手法を提案し、その有効性を示す。
要約
本研究では、絵文字の説明から感情分析用辞書を自動生成する手法を提案している。
まず、大量の非構造化テキストデータから絵文字を抽出し、その説明をEmojipeediaから取得する。次に、感情分析システムを用いて、これらの説明文の感情を分析する。
この感情分析の結果から、各絵文字の感情値を推定し、感情分析用の辞書を自動生成する。
さらに、この辞書を用いて非構造化テキストの感情分析を行い、その有効性を検証している。
実験では、スペイン語と英語のツイートデータを用いて評価を行っている。その結果、提案手法は、既存手法と比較して高い精度を示すことが確認された。
この手法は、感情分析の精度向上に貢献できるだけでなく、絵文字の感情的な意味を自動的に把握できるため、様々なソーシャルメディア分析に活用できると考えられる。
統計
絵文字を含むスペイン語ツイートは214,948件、そのうち12,759件が感情付きで、613種類の絵文字が使用されていた。
絵文字を含む英語ツイートは59,107件、そのうち10,639件が感情付きで、624種類の絵文字が使用されていた。
スペイン語と英語を合わせると、704種類の絵文字が使用されていた。