核心概念
本文提出了一個通信理論的觀點來分析大型語言模型的重排序策略。我們將生成器視為一個發送者,通過多個並行的噪聲通道傳輸多個描述。接收器(重排序器)通過對這些描述進行排序和選擇來解碼消息。在此框架下,我們提供了一些條件,使得即使重排序器不完美,該協議也可以漸近無錯誤。
要約
本文提出了一個通信理論的觀點來分析大型語言模型的重排序策略。
-
生成器G被視為一個發送者,通過多個並行的噪聲通道傳輸N個可接受答案(描述)。接收器R(重排序器)的目標是通過對這些描述進行排序和選擇來解碼出一個可接受的答案。
-
在假設描述是獨立的情況下:
- 如果重排序器R是完美的,則錯誤概率呈指數級下降。
- 如果重排序器R是由Mallows模型描述的,則即使不完美,協議仍然漸近無錯誤,且錯誤概率呈指數級下降。
- 如果重排序器R是由Zipf-Mandelbrot模型描述的,則協議仍然漸近無錯誤,但錯誤概率下降較慢,呈冪律下降。
-
在描述存在依賴性的情況下:
- 如果重排序器R是完美的,且描述之間的依賴性由Beta分佈建模,則錯誤概率呈冪律下降。
- 即使描述存在依賴性,只要在獨立描述的情況下協議是漸近無錯誤的,那麼在依賴性情況下協議仍然是漸近無錯誤的。
-
實驗結果驗證了理論分析,在文本到代碼生成和醫療機器翻譯任務中,我們觀察到與理論預測一致的重排序行為。
統計
以下是一些重要的統計數據:
在文本到代碼生成任務中,當使用多數投票重排序時,我們得到了α = 0.1, β = 0.283, γ = 0.07, e−λ = 0.001。
在醫療機器翻譯任務中,當使用基於質量估計的重排序時,我們得到了α = 0.1, β = 0.46, γ = 0.001, e−λ = 0.005。
當使用基於最小貝葉斯風險的重排序時,我們得到了α = 0.1, β = 0.46, γ = 0.182, e−λ = 0.001。