大型語言模型 (LLM) 在自動生成系統評價 (SLR) 的布林查詢方面顯示出潛力,但仍存在可複製性、可靠性和對召回率影響等問題,需要進一步研究和改進。
G-RAG 是一種基於圖數據庫的檢索增強生成技術,透過整合圖數據庫和實體鏈接,有效提升了材料科學領域資訊檢索和知識生成的準確性和上下文相關性。
本文提出了一種新的對話式產品搜尋模型 ConvPS,透過在統一的生成框架中整合使用者、查詢、產品和對話的表示學習,幫助使用者更有效地找到目標產品。
本研究提出了一種名為「對比累積」(CONTACCUM)的新方法,透過使用雙記憶庫結構來緩存查詢和文章表示,從而在記憶體受限的環境下,有效地訓練密集檢索器,並超越了現有的記憶體縮減方法,甚至優於高資源配置的訓練結果。
本文提出了一個名為 LEADRE 的新型框架,利用大型語言模型 (LLM) 的世界知識來改進傳統展示廣告推薦系統,並解決了在廣告領域應用 LLM 的三個關鍵挑戰:如何捕捉用戶興趣、如何彌合 LLM 與廣告系統之間的知識差距以及如何有效地部署 LLM。
本文介紹了一種稱為混合邏輯迴歸(MoL)的新方法,用於在推薦系統、搜尋和自然語言處理等資訊檢索任務中,以學習相似度函數取代傳統的點積相似度函數,並提出了有效的近似演算法,以實現高效的檢索。
這篇文章評估了七種文本檢索模型在捷克語檢索資料集 DaReCzech 上的表現,發現 Gemma2 模型在準確率和召回率方面表現最佳,但需要較大的索引大小;SPLADE 模型的索引大小最小,適合資源有限的情況;PLAID 模型則提供了性能和效率之間的平衡。
SymphonyQG 是一種新的近似最近鄰搜尋(ANN)演算法,它通過將量化技術 RaBitQ 與圖結構索引更協同地整合,顯著提升了搜尋效能和索引速度。
本文提出了一種利用語音活動、音樂結構分析和零樣本音頻分類技術,從個人音樂收藏中自動檢索 DJ 工具的方法。
雖然重排序器通常被認為可以提升資訊檢索的品質,但本研究發現,當擴展到對大量文件進行重排序時,現有的重排序器會出現效能顯著下降的情況,甚至可能不如單獨使用檢索器。