核心概念
本文提出了一種名為多頭 RAG (MRAG) 的新型檢索增強生成 (RAG) 方法,旨在解決需要檢索多個不同內容文件之複雜查詢的挑戰,透過利用 Transformer 模型中多頭注意力層的激活值作為嵌入,MRAG 能夠更準確地捕捉資料和查詢的多樣性,從而在多面向查詢中提高資訊檢索的準確性和相關性。
摘要
論文資訊
- 標題:多頭 RAG:利用大型語言模型解決多面向問題
- 作者:Maciej Besta 等人
- 機構:蘇黎世聯邦理工學院、Cledar、巴斯夫公司、華沙科技大學
- 發表日期:2024 年 11 月 19 日
研究背景
大型語言模型 (LLM) 在許多機器學習任務中取得了顯著的成果,然而,LLM 仍然面臨著資訊過時、隱私洩露和幻覺等問題。檢索增強生成 (RAG) 作為一種解決方案,透過將檢索系統整合到生成模型中,使 LLM 能夠從大型資料庫中提取相關資訊,從而提供更準確和可靠的回應。
研究問題
現有的 RAG 方案並未針對需要提取多個內容差異較大之文件的多面向查詢進行優化。這些查詢在實際應用中很常見,但由於相關文件的嵌入向量在嵌入空間中可能相距甚遠,因此難以全部檢索到。
研究方法
本文提出了多頭 RAG (MRAG),這是一種利用 Transformer 模型中多頭注意力層激活值作為嵌入的新型 RAG 方案。與僅使用最後一個解碼器層輸出的標準 RAG 不同,MRAG 利用多頭注意力機制來捕捉資料的不同面向,從而更全面地表示資料和查詢。
MRAG 流程
- **資料準備:**使用選定的嵌入模型(例如 SFR 或 e5)為每個文本塊創建多面向嵌入,並將其存儲在向量資料庫中。
- **查詢執行:**生成輸入查詢的多面向嵌入,並使用多面向檢索策略在資料庫中查找最接近的多面向嵌入及其對應的文本塊。
評估方法
- **資料集:**使用維基百科文章和真實世界的法律文件以及化工廠事故報告構建多面向資料集。
- **查詢生成:**使用 LLM 生成涵蓋不同面向的查詢。
- **指標:**使用檢索成功率、類別檢索成功率和加權檢索成功率來評估 MRAG 的性能。
研究結果
- MRAG 在多面向查詢中顯著優於標準 RAG,平均檢索成功率提高了 10-20%。
- MRAG 在單面向查詢中表現與標準 RAG 相當。
- 結合 Fusion RAG 可以進一步提高 MRAG 的性能。
研究貢獻
- 提出了一種解決多面向查詢的新型 RAG 方案 MRAG。
- 建立了評估多面向 RAG 性能的方法和指標。
- 發布了用於評估 RAG 方案的多面向資料集。
- 證明了 MRAG 在多面向查詢中的有效性和效率。
研究限制
- MRAG 的性能取決於所使用的嵌入模型和檢索策略。
- 多面向資料集的構建和查詢生成需要進一步研究。
未來方向
- 研究更先進的嵌入模型和檢索策略以進一步提高 MRAG 的性能。
- 將 MRAG 應用於其他領域,例如問答系統和文件摘要。
統計資料
MRAG 在多面向查詢中平均比標準 RAG 的檢索成功率提高了 10-20%。
MRAG 在使用 30 個文件進行檢索時,對於精確文件匹配的檢索成功率平均提高了 10% 以上,對於僅類別匹配的檢索成功率平均提高了 25% 以上。
引述
"現有的 RAG 方案並未針對需要提取多個內容差異較大之文件的多面向查詢進行優化。"
"我們引入了多頭 RAG (MRAG),這是一種利用 Transformer 模型中多頭注意力層激活值作為嵌入的新型 RAG 方案。"
"我們的綜合評估方法,包括特定指標、合成資料集和真實世界的用例,證明了 MRAG 的有效性。"