本論文は、大規模言語モデルを活用した新しい検索フレームワーク「LLM-augmented retrieval」を提案している。このフレームワークでは、文書の埋め込みに合成クエリ、タイトル、パッセージの情報を組み合わせた「文書レベルの埋め込み」を生成する。これにより、既存の検索モデル(Bi-encoder、late-interaction モデル)の性能を大幅に向上させることができる。
具体的な手順は以下の通り:
実験の結果、この手法によって、Bi-encoder モデル(Contriever、DRAGON)とlate-interaction モデル(ColBERTv2)の性能が大幅に向上し、state-of-the-art の結果を達成した。特に、Bi-encoder モデルでは合成クエリが最も重要な役割を果たすことが分かった。一方、late-interaction モデルでは合成クエリとタイトルの両方が重要であることが示された。
本手法は、既存の検索モデルの性能を大幅に向上させることができ、情報検索分野への大きな貢献が期待される。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Mingrui Wu,S... at arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.05825.pdfDeeper Inquiries