核心概念
マルチドキュメントサマリゼーションにおいて、入力データの順序によって生成されるサマリの公平性が大きく影響を受けることが明らかになった。一方で、生成されるサマリの質的な側面には大きな差は見られない。
要約
本研究は、マルチドキュメントサマリゼーションにおける位置バイアスの影響を分析したものである。
まず、人間が作成した参照サマリには位置バイアスが見られないことを確認した。一方で、システムが生成したサマリでは、入力データの順序によって大きな違いが見られた。
具体的には、入力データを社会グループ別に順序付けした場合、最初に登場するグループに有利なサマリが生成される傾向にあった。一方で、入力データをランダムに並べ替えた場合、各グループが均等に表現されたサマリが生成された。
このように、位置バイアスはサマリの公平性に大きな影響を及ぼすことが明らかになった。一方で、サマリの質的な側面については、入力データの順序による差は小さいことが示された。
この結果は、マルチドキュメントサマリゼーションシステムの公平性を確保するためには、入力データのランダム化が重要であることを示唆している。また、サマリの質と公平性のトレードオフを理解し、適切なバランスを取ることが課題となる。
統計
入力データの先頭に位置するグループのサマリ内容が最も高くなる傾向がある。
引用
"マルチドキュメントサマリゼーションにおいて、入力データの順序によって生成されるサマリの公平性が大きく影響を受けることが明らかになった。"
"一方で、サマリの質的な側面については、入力データの順序による差は小さいことが示された。"