Core Concepts
Generating full-length Wikipedia articles for emergent events using retrieval-based methods is challenging but crucial.
Abstract
本研究旨在通过检索方法生成紧急事件的完整维基百科文章。研究提出了新的任务,创建了一个新的基准数据集WikiGenBen,包括309个紧急事件的相关文档,并引入了全面评估指标来衡量生成流畅、信息丰富和忠实的维基百科文件。实验结果表明,在保持信息丰富性和忠实性方面存在复杂的平衡。此外,强调了通过任务分割方法来进一步提高性能的必要性。
Stats
309個緊急事件相關文檔組成WikiGenBen數據集。
使用GPT-3.5進行生成,Fluent Score達到4.31。
搜索引擎檢索相關文檔效果優於人工編輯提供的文檔。
Quotes
"Generating full-length Wikipedia articles for emergent events using input retrieved from web sources is crucial in today's fast-paced world."
"In this paper, a new benchmark WikiGenBen is introduced, consisting of 309 events paired with their corresponding retrieved web pages for generating evidence."
"Our experiments shed light on the intricate balance between various metrics, highlighting the task’s complexity."