Core Concepts
YORO是一種新的訓練範式,通過在合成的文本到SQL數據上對專家模型進行微調,來獲取資料庫知識,從而在推理時無需訪問資料庫即可回答問題。
Abstract
本文提出了一種名為「一次閱讀」(YORO)的新訓練範式,用於解決文本到SQL的轉換任務。YORO包括兩個主要階段:
-
資料庫知識獲取階段:
- 通過在合成的文本到SQL數據上對專家模型進行微調,來全面理解目標資料庫的內容並將其內化到模型參數中。
- 這種方法可以顯著減少推理時的輸入長度,並消除對值檢索的依賴。
-
問題理解和SQL生成階段:
- 在推理時,YORO專家模型可以直接將自然語言問題轉換為SQL查詢,而無需訪問資料庫模式信息。
- 與傳統方法相比,YORO的輸入長度減少了66%-98%,同時在三個基準測試集上表現出與傳統方法相當或更好的性能。
- YORO在處理大型資料庫和具有挑戰性的值檢索場景時表現出明顯優勢。
總的來說,YORO是一種新穎的訓練範式,通過內化資料庫知識來提高文本到SQL轉換的效率和性能。
Stats
傳統方法的平均輸入長度約為1979個token,而YORO的平均輸入長度僅為50個token。
傳統方法需要重複編碼相同的資料庫模式,而YORO則無需此步驟。
傳統方法需要依賴值檢索步驟,而YORO則無需此步驟。
Quotes
"YORO顯著減少了輸入長度,同時在三個基準測試集上表現出與傳統方法相當或更好的性能。"
"YORO在處理大型資料庫和具有挑戰性的值檢索場景時表現出明顯優勢。"