核心概念
通过会话问题重构、细粒度检索和自检机制,提高大语言模型在会话式问答任务中的性能。
摘要
本文提出了一种会话式检索增强生成(ConvRAG)方法,用于提升会话式问答(CQA)的性能。该方法包括三个主要组件:
-
会话问题重构器:
- 通过问题重写和关键词提取,更好地理解会话上下文中的问题。
- 问题重写可以明确问题中涉及的概念,关键词提取有助于检索相关信息。
-
细粒度检索器:
- 采用三阶段检索方法,包括文档级检索、段落级召回和段落级重排。
- 根据重写问题和关键词,检索最相关的段落信息。
-
基于自检的响应生成器:
- 检查检索结果的有用性,过滤掉无关或噪声信息。
- 利用有用的检索结果和模型自身知识生成最终响应。
实验结果表明,该方法在基准测试集和新构建的中文CQA数据集上均优于现有的检索增强方法和工业系统。特别是问题重构组件的贡献最为关键,显著提升了性能。该工作为利用检索增强提升会话式问答提供了新思路。
統計資料
在 630 AD 年发生。
检索到的段落(1)对回答问题有帮助,
检索到的段落(2)对回答问题有帮助,
检索到的段落(3)对回答问题无帮助,
因此我可以利用相关的段落(1)和(2),结合自身知识来回答问题。