Core Concepts
多様な候補要約から正の指示的情報と負の指示的情報を抽出し、ランク付けすることで、多文書科学要約の性能を向上させることができる。
Abstract
本研究では、多文書科学要約(MDSS)の性能向上のために、候補要約の活用に着目している。具体的には以下の2つの洞察に基づいて提案手法を開発した:
候補要約には、正の指示的情報と負の指示的情報が含まれており、これらを適切に活用することが重要である。
複数の候補要約から高品質な候補を選択することで、より良い要約を生成できる。
提案手法の概要は以下の通り:
候補要約のランキングモジュール: 候補要約の品質を判別し、上位の候補を選択する。
指示的情報のモデル化と分離モジュール: 候補要約の正の指示的情報と負の指示的情報を別々の潜在変数でモデル化し、相互に分離する。
情報増強デコーディングモジュール: 選択された候補要約の情報を入力文脈と生成プロセスに組み込む。
提案手法をTransS2S、KGSum、BARTモデルに適用し、3つの大規模MDSSデータセットで評価した結果、従来手法に比べて大幅な性能向上が確認された。特に、KGSum + DIRは新しい最先端性能を達成した。
Stats
多文書科学要約の性能は、候補要約の正の情報の量に正の相関がある。
上位3つの候補要約を選択することで、正の情報量が最大化される。
Quotes
"Summary candidates can provide instructive information from both positive and negative perspectives"
"Ranking and selecting higher-quality candidates from a pool of multiple candidates helps to produce better second-stage summaries"