核心概念
本文提出了一種結合漸進式資料集建構(PDC)和動態遮罩監督微調(DM-SFT)的方法,用於增強大型語言模型(LLM)修復 SQL 錯誤的能力。
摘要
增強大型語言模型修復 SQL 錯誤能力:基於 PDC 與 DM-SFT 的方法
本研究旨在提升大型語言模型(LLM)修復 SQL 錯誤的能力,特別是針對 SQL 程式碼中複雜的巢狀查詢結構所帶來的挑戰。
研究提出了一套名為漸進式資料集建構(PDC)的資料收集方法,以及一種基於動態遮罩的高效訓練方法,稱為動態遮罩監督微調(DM-SFT)。
漸進式資料集建構(PDC)
PDC 包含兩個部分:
多元線上系統收集(廣度優先): 從線上系統中挖掘使用者行為日誌,收集包含錯誤 SQL 程式碼、錯誤訊息和正確 SQL 程式碼的資料集。
定向離線挖掘生成(深度優先): 針對模型表現不佳的錯誤類型,利用規則匹配和程式碼 LLM 生成增強資料,以擴充資料集。
動態遮罩監督微調(DM-SFT)
DM-SFT 是一種針對程式碼錯誤修復任務設計的訓練方法,其特點如下:
動態遮罩: 在訓練過程中,僅計算需要修改的程式碼行的損失,而忽略與原始錯誤 SQL 程式碼相同的程式碼行,從而提高訓練效率和模型效能。
隨機遮罩比例: 引入一個隨機遮罩比例因子 p,用於控制被遮罩的程式碼行比例,實驗表明,當 p 值介於 0.4 到 0.7 之間時,模型效能最佳。