本文提出了一個新的概念"指令嵌入",它是文本嵌入的一個專門子集,其重點是任務識別,而不是提取句子級語義信息。
文本嵌入在許多NLP任務中發揮關鍵作用,如語義相似性和信息檢索。但是,當涉及指令嵌入時,關鍵應該是識別任務類別,而不是捕捉整體語義信息。這是因為,指令微調幫助模型學習如何與用戶跨不同任務進行交互,而不是特定的能力和知識。
作者構建了指令嵌入基準(IEB),其中指令被標記為任務類別,而不是語義相似性。IEB包含47k個樣本,分散在1k多個類別中。
作者提出了一種基於提示的指令嵌入(PIE)方法,通過引導模型關注任務類型來生成指令嵌入。PIE可以在無監督和監督微調的設置下工作,並在IEB上的任務識別和意圖相似性測試中表現優異。
作者還在四個下游任務中評估了指令嵌入的效果,如數據選擇和示範檢索,結果表明指令嵌入比傳統文本嵌入更適合指令相關任務。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yiwei Li, Ji... at arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19680.pdfDeeper Inquiries