核心概念
本文提出了一種名為 ChatHTTPFuzz 的新型物聯網 HTTP 協議模糊測試方法,該方法利用大型語言模型 (LLM) 的能力來自動化和增強測試過程,以發現傳統方法難以發現的漏洞。
研究背景
隨著物聯網 (IoT) 設備的快速發展,其安全問題日益凸顯。物聯網設備通常使用 HTTP 協議作為其 Web 服務接口,而這些接口的設計缺陷可能導致嚴重的安全風險。模糊測試是一種有效的漏洞檢測技術,但傳統的模糊測試工具在處理 HTTP 協議的複雜性和物聯網設備的獨特軟硬件特性方面存在局限性。
研究目標
本研究旨在開發一種基於大型語言模型 (LLM) 的新型物聯網 HTTP 協議模糊測試方法,以解決傳統模糊測試工具的局限性,並提高物聯網設備的安全性。
研究方法
本研究提出的 ChatHTTPFuzz 方法利用 LLM 的強大功能,自動化和增強了模糊測試過程。具體而言,ChatHTTPFuzz 採用以下三個核心技術:
**LLM 引導的 HTTP 協議變量註釋 (LVA) 技術:**該技術利用預設的提示指令,驅動 LLM 準確地標記 HTTP 協議數據中的變量,並根據變量類型屬性定義變異數據類型,從而提高測試的準確性和效率。
**LLM 引導的種子模板豐富 (LSTE) 算法:**該算法通過數據包擴展和字段值豐富兩種方法來改進種子模板庫。數據包擴展方法利用 LLM 解釋靜態分析的後端代碼,生成新的數據包;字段值豐富方法則通過分析後端代碼中的字段處理邏輯,提取變量字段的潛在值集。
**基於強化學習的雙因素增益種子模板調度算法 (STSA):**該算法通過引入探索平衡因子和變異潛力因子,增強了傳統的 Thompson Sampling 算法,從而更有效地調度種子模板。
主要發現
實驗結果表明,ChatHTTPFuzz 在 14 種不同的真實物聯網設備上成功識別出 103 個安全漏洞,其中 68 個是以前未公開的,23 個已獲得官方 CVE 識別碼。與現有的模糊測試工具相比,ChatHTTPFuzz 發現的漏洞數量顯著增加,證明了其在物聯網安全測試中的有效性。
研究結論
本研究提出的 ChatHTTPFuzz 方法為物聯網 HTTP 協議模糊測試提供了一種新的思路。通過利用 LLM 的強大功能,ChatHTTPFuzz 能夠自動化和增強測試過程,從而更有效地發現傳統方法難以發現的漏洞。
研究意義
本研究的成果對於提高物聯網設備的安全性具有重要意義。ChatHTTPFuzz 可以幫助開發人員和安全研究人員更有效地發現和修復物聯網設備中的安全漏洞,從而降低物聯網設備遭受攻擊的風險。
研究局限與未來方向
本研究存在一些局限性,例如,ChatHTTPFuzz 的性能可能受到所使用的 LLM 的影響,並且需要進一步優化以提高其效率。未來研究方向包括:
研究如何進一步提高 ChatHTTPFuzz 的效率和可擴展性。
將 ChatHTTPFuzz 應用於其他類型的物聯網設備和協議。
開發更先進的 LLM 引導的模糊測試技術。
統計資料
全球物聯網設備數量預計到 2024 年將達到 170.2 億台,到 2030 年將達到約 300 億台。
在識別 HTTP 協議字段方面,LLM 的錯誤率為 0%,假陰性率僅為 4.74%。
在分析代碼邏輯時,LLM 對數據包字段的覆蓋率達到 98.58%。
ChatHTTPFuzz 在 14 種不同的真實物聯網設備上成功識別出 103 個安全漏洞,其中 68 個是以前未公開的,23 個已獲得官方 CVE 識別碼。