本論文では、公開されているさまざまなランキングモデルのベンチマークを行い、ランキングの精度への影響を検討する。質問応答タスクのテキスト検索に焦点を当て、商用アプリケーションに使用可能なモデルを含む。
NV-RerankQA-Mistral-4B-v3という最先端のランキングモデルを紹介し、Mistral 7Bからの剪定と微調整の手法について説明する。この新しいモデルは、他のリランカーと比べて14%の精度向上を達成している。
さらに、モデルサイズ、ランキング精度、インデキシングやサービスのレイテンシー/スループットなどのシステム要件のトレードオフについて議論する。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Gabriel de S... ที่ arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07691.pdfสอบถามเพิ่มเติม