Khái niệm cốt lõi
大規模言語モデルを活用した指示に基づく非監督パッセージ再ランキング方法の紹介と効果的性能の強調。
Tóm tắt
Abstract:
INTSUPRは大規模言語モデル(LLMs)に基づく非監督パッセージ再ランキング手法を紹介し、指示に従う能力を活用している。
従来のアプローチと異なり、追加の微調整なしでパッセージ再ランキングを実現する。
Introduction:
情報検索(IR)は、ユーザークエリに対して大量のデータから関連情報を取得することを含む。
LLMsはゼロショット能力を示し、UNSUPRやTART-Rerankよりも優れた結果を示す。
Related Work:
DPRフレームワークやGTRなど、深層学習ベースの検索モデルが登場している。
INSTUPRは第二段階のパッセージ再ランキングに焦点を当てている。
Our Method:
パッセージ再ランキングタスクでは、各ドキュメントに関連スコアを割り当てることが目的。
INSTUPRはLLMsの指示に従う能力を活用しており、ソフトスコア集約技術やペアワイズ再ランキング手法も提案されている。
Experiments:
TREC DL19、DL20、BEIRでの実験結果では、INSTUPRが他の手法よりも優れた性能を発揮していることが示されている。
Conclusion:
INSTUPRはLLMsを情報検索タスクに活用する可能性を示し、将来的な研究ではLLMsの規模が再ランキングパフォーマンスに与える影響や効率的なペアワイズ再ランキング技術が探求されるべきである。
Thống kê
大規模言語モデル(LLMs)はゼロショット能力を持つ(Brown et al., 2020; Kojima et al., 2022)。