Core Concepts
消費者イベントの原因を効率的に抽出するための新しいシーケンスタギングフレームワークを提案する。
Abstract
本論文では、消費者イベントの原因を効率的に抽出するための新しいアプローチを提案している。従来の手法では、イベントタイプと原因の抽出を別々に行っていたが、本手法では、シーケンスタギングフレームワークを用いて、イベントタイプと原因を同時に抽出する。
具体的には、以下の手順で行う。
BERT エンコーダを用いて、入力テキストとブランド/製品の特徴を抽出する。
シーケンスタギングデコーダを用いて、イベントタイプと原因を同時に予測する。シーケンスタギングデコーダでは、条件付き確率場(CRF)を用いて、ラベル間の相関を考慮する。
実験の結果、提案手法は従来手法と比べて大幅に性能が向上することが示された。特に、BERT エンコーダを初期化せずに学習した場合でも、提案手法の性能が良好であることが分かった。これは、新しいシーケンスタギングフレームワークの有効性を示している。
本手法は、ICDM 2020 Knowledge Graph Contestの消費者イベントの原因抽出タスクにおいて、1次リーダーボードで1位、最終リーダーボードで3位を獲得した。
Stats
消費者イベントの原因を正しく予測した数 / 予測した原因の総数
消費者イベントの原因を正しく予測した数 / 正解の原因の総数
Quotes
"従来の手法では、イベントタイプと原因の抽出を別々に行っていたが、本手法では、シーケンスタギングフレームワークを用いて、イベントタイプと原因を同時に抽出する。"
"提案手法は従来手法と比べて大幅に性能が向上することが示された。特に、BERT エンコーダを初期化せずに学習した場合でも、提案手法の性能が良好であることが分かった。これは、新しいシーケンスタギングフレームワークの有効性を示している。"