本文探討了在基於大型語言模型(LLM)的推薦系統中使用非英語提示對推薦性能的影響。作者首先介紹了LLM在推薦系統中的應用,以及相關的挑戰,如位置偏差、流行度偏差和幻覺等。
作者使用OpenP5平台,將英語提示擴展到包括西班牙語和土耳其語,並在ML1M、LastFM和Amazon-Beauty三個數據集上進行了評估。結果顯示,使用非英語提示通常會降低性能,尤其是對於與英語差異較大的語言,如土耳其語。
此外,作者還嘗試在多語言提示下重新訓練模型,發現這樣可以獲得更平衡的跨語言性能,但英語提示的性能略有下降。
總的來說,這項工作突出了在基於LLM的推薦系統中需要支持多語言的重要性,並為未來的研究提供了方向,如創建多語言評估數據集,以及使用更新的模型和其他語言。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問