本研究は、マルチドキュメントサマリゼーションにおける位置バイアスの影響を分析したものである。
まず、人間が作成した参照サマリには位置バイアスが見られないことを確認した。一方で、システムが生成したサマリでは、入力データの順序によって大きな違いが見られた。
具体的には、入力データを社会グループ別に順序付けした場合、最初に登場するグループに有利なサマリが生成される傾向にあった。一方で、入力データをランダムに並べ替えた場合、各グループが均等に表現されたサマリが生成された。
このように、位置バイアスはサマリの公平性に大きな影響を及ぼすことが明らかになった。一方で、サマリの質的な側面については、入力データの順序による差は小さいことが示された。
この結果は、マルチドキュメントサマリゼーションシステムの公平性を確保するためには、入力データのランダム化が重要であることを示唆している。また、サマリの質と公平性のトレードオフを理解し、適切なバランスを取ることが課題となる。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы