แนวคิดหลัก
増分的な設定で効率的に正確な意見要約を生成するためのカバーツリーベースのアルゴリズムCoverSummを提案する。
บทคัดย่อ
本論文では、増分的な設定での抽出型意見要約の問題を研究している。従来の中心性ベースの要約手法は、効率的に増分的に動作することができない。
そこで、本研究では、CoverSummと呼ばれる新しいアルゴリズムを提案している。CoverSummは、カバーツリーを利用して、中心性ベースの要約を効率的に行う。
理論的な分析により、CoverSummが正確な最近傍を生成し、必要な最近傍検索クエリ数を最小限に抑えられることを示している。
実験的にも、CoverSummが従来手法に比べて最大36倍高速であり、生成された要約が元の意見と整合的であることを示している。
また、人間評価実験により、CoverSummが生成する要約が冗長性が低く、情報性が高いことを確認している。
สถิติ
提案手法CoverSummは従来手法に比べて最大36倍高速である。
CoverSummの生成する要約は、ユーザー評価やセンチメント極性、アスペクトの観点から、元の意見と整合的である。
人間評価実験の結果、CoverSummの生成する要約は冗長性が低く、情報性が高い。
คำพูด
"Extractive opinion summarization involves automatically producing a summary of text about an entity (e.g., a product's reviews) by extracting representative sentences that capture prevalent opinions in the review set."
"Typically, in online marketplaces user reviews accumulate over time, and opinion summaries need to be updated periodically to provide customers with up-to-date information."
"Many of the state-of-the-art extractive opinion summarization approaches are centrality-based, such as CentroidRank (Radev et al., 2004; Chowdhury et al., 2022). CentroidRank performs extractive summarization by selecting a subset of review sentences closest to the centroid in the representation space as the summary."