المفاهيم الأساسية
整合大型語言模型 (LLM) 的應用程式存在著遠端程式碼執行 (RCE) 漏洞的風險,攻擊者可以透過提示注入操控 LLM 產生惡意程式碼,進而控制應用程式伺服器。
這篇研究論文揭露了整合大型語言模型 (LLM) 的應用程式中存在的一種新型態安全威脅:遠端程式碼執行 (RCE) 漏洞。作者們開發了一個名為 LLMSmith 的工具,用於偵測、驗證和利用這些漏洞。
研究背景
LLM 在軟體開發領域展現出巨大潛力,越來越多應用程式開始整合 LLM 以提升智慧化程度。然而,這些整合 LLM 的應用程式也引入了新的安全風險。由於 LLM 本身行為的不可預測性和隨機性,攻擊者可能透過精心設計的提示注入攻擊,操控 LLM 產生惡意程式碼,進而控制應用程式伺服器。
LLMSmith 工具
為了應對這個新興威脅,作者們開發了 LLMSmith 工具,該工具包含以下功能:
漏洞偵測: LLMSmith 使用輕量級靜態分析技術掃描框架原始碼,提取從使用者層級 API 到危險函數的呼叫鏈,並驗證其可利用性。
應用程式收集: LLMSmith 從程式碼託管平台和應用程式市場收集可能受影響的 LLM 整合應用程式,涵蓋白盒(原始碼可用)和黑盒(原始碼不可用)兩種情況。
漏洞利用: LLMSmith 提出了一種基於提示的系統性漏洞利用方法,結合了幻覺測試、LLM 逃逸等多種策略,以驗證和利用 RCE 漏洞。
研究發現
LLMSmith 在 11 個 LLM 整合框架中發現了 20 個漏洞,其中 13 個漏洞被分配了 CVE 編號,6 個漏洞的 CVSS 評分為 9.8 分。此外,LLMSmith 在 51 個可能受影響的應用程式中成功執行了攻擊,其中 16 個應用程式存在 RCE 漏洞,1 個應用程式存在 SQL 注入漏洞。
研究貢獻
這篇論文的主要貢獻包括:
提出了一種有效且輕量級的方法來偵測 LLM 整合框架中的 RCE 漏洞。
提出了一種基於提示的 LLM 整合應用程式漏洞利用方法。
首次對這些新型 RCE 攻擊向量、漏洞和實際攻擊進行了系統分析。
研究意義
這篇論文的研究結果揭示了整合 LLM 的應用程式所面臨的嚴重安全威脅,並提供了一種有效的工具來偵測和利用這些漏洞。這些發現對於 LLM 整合框架和應用程式的開發者具有重要的參考價值,有助於他們開發更安全的應用程式。
الإحصائيات
LLMSmith 在 11 個 LLM 整合框架中發現了 20 個漏洞。
13 個漏洞被分配了 CVE 編號。
6 個漏洞的 CVSS 評分為 9.8 分。
LLMSmith 在 51 個可能受影響的應用程式中成功執行了攻擊。
16 個應用程式存在 RCE 漏洞。
1 個應用程式存在 SQL 注入漏洞。