核心概念
本文提出了一種利用大型語言模型將自然語言查詢轉換為結構化搜尋查詢的方法,以提升企業搜尋的易用性及效率。
摘要
論文概述
本研究論文探討了如何利用大型語言模型 (LLM) 改進現有市場推廣平台上企業搜尋功能的用戶體驗。作者指出,傳統的進階搜尋介面雖然功能強大,但對非技術人員來說過於複雜且難以使用。為了解決這個問題,作者提出了一種基於 LLM 的解決方案,可以將自然語言查詢轉換為結構化的搜尋查詢,從而簡化搜尋過程。
研究方法
作者首先將自然語言查詢轉換為包含進階搜尋欄位的 JSON 格式,再將其轉換為平台可執行的搜尋服務查詢。這種兩階段轉換方法有效避免了直接生成搜尋服務查詢時可能出現的語法錯誤,同時也簡化了人工標註資料的建立過程。
為了優化 LLM 的效能,作者採用了多種進階提示工程技術,包括系統訊息、少樣本學習和思維鏈提示。系統訊息詳細定義了 LLM 的角色、資料庫結構以及任務邏輯。少樣本學習通過提供少量範例幫助模型理解預期輸出格式和推理過程。思維鏈提示則引導 LLM 逐步推理,以準確地將自然語言查詢轉換為 JSON 格式。
實驗結果
作者使用多種相似度指標評估了不同 LLM 模型的效能,包括精確匹配、Jaccard 相似度、餘弦相似度和語義相似度。實驗結果顯示,經過提示工程和執行優化後,Claude 3.5 Sonnet 模型在所有指標上均取得了最佳效能,平均查詢準確率高達 97%。此外,作者還對開源模型 Llama3-8B-Instruct 進行了微調,結果顯示其效能與 Anthropic 模型相當。
研究結論
本研究證明了利用 LLM 將自然語言查詢轉換為結構化搜尋查詢的可行性和準確性,為現有市場推廣平台的進階搜尋功能提供了一種有效且簡化的替代方案。隨著技術的進步,自然語言搜尋將進一步提升資訊檢索過程的易用性和效率。
未來方向
作者計劃在未來微調最新的 Llama 模型,並實現支援否定邏輯和意圖查詢的進階查詢功能,同時保持現有的準確率。
統計資料
在 509 個自然語言查詢中,只有不到 10 個查詢是進階搜尋支援但 LLM 不支援的。
約有 100 個查詢進階搜尋本身也不支援。
Claude 3.5 Sonnet 模型在所有指標上的平均查詢準確率高達 97%。
在所有個別欄位中,只有三個欄位的效能統計數據低於 95%,只有一個欄位低於 90% 的門檻。
對於營收和員工數量的精確匹配,分數分別為 0.997、1.0、1.0 和 0.995,排序依序為營收(下限、上限)和員工數量(下限、上限)。
GPT-3.5-Turbo 的平均得分為 0.933。
Haiku 的平均得分為 0.958。
微調後的 Llama3-8B-Instruct 模型的平均得分為 0.956。
引述
"Generating the search service query directly from the LLM would likely result in problems such as missing semicolons, misplaced fields, and incorrect structure, making execution refinement impractical."
"The most accurate and advanced model tested was Anthropic’s Claude 3.5 Sonnet [3], which showcased a remarkable average query accuracy of 97%."
"Overall, this paper offers a natural language solution for enterprise searches on GTM platforms. We show not only the feasibility but also the extraordinary accuracy of such a solution, overshadowing the original cumbersome advanced search."