本研究提出了E-SQL,一種專門設計用於解決文字到SQL轉換任務中的挑戰的新管線。E-SQL包含以下四個主要模組:
候選SQL生成(CSG)模組:生成初步的SQL查詢。
候選謂語生成(CPG)模組:從生成的SQL查詢中提取值和操作,並使用LIKE運算符從資料庫中找到相似的值,構建候選謂語。
問題豐富化(QE)模組:指示語言模型將相關的資料庫項目(如表、列和值)和條件直接納入問題中,以增強問題與資料庫架構的連結。
SQL改進(SR)模組:利用豐富的問題、候選謂語和任何識別的執行錯誤,生成新的SQL查詢或改進現有的候選SQL查詢。
實驗結果表明,E-SQL在處理複雜查詢方面特別出色,在BIRD基準測試的測試集上達到了66.29%的執行準確率。此外,我們的實驗還發現,當與先進的大型語言模型一起使用時,傳統的資料庫架構過濾技術可能會降低性能。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies