核心概念
大型語言模型 (LLMs) 正逐漸被應用於異常和域外偵測任務,展現出超越傳統方法的潛力。
這篇研究論文全面概述了大型語言模型 (LLMs) 和多模態 LLMs (MLLMs) 在異常和域外 (OOD) 偵測領域的應用。論文首先提出了一個新的分類法,根據 LLMs 在架構中的角色將方法分為兩大類:偵測和生成。
LLMs 作為偵測器
此類方法利用 LLMs 本身的知識來偵測異常或 OOD 樣本,又可細分為兩種:
基於提示的偵測方法
此類方法透過設計結構化的提示模板,引導 LLMs 生成包含偵測結果的語言回應。研究者們結合了角色扮演提示、上下文學習和思維鏈等技術來創建有效的提示模板。例如,SIGLLM、LLMAD 和 LogPrompt 等研究專注於時間序列和日誌數據的異常偵測。
基於對比的偵測方法
此類方法主要應用於多模態場景,利用經過對比目標預先訓練的 MLLMs 作為偵測器。例如,CLIP 模型透過比較圖像特徵和文本特徵的相似性來判斷樣本是否為異常或 OOD。
LLMs 作為生成器
此類方法利用 LLMs 的生成能力來增強異常和 OOD 偵測,主要分為兩類:
以增強為中心的生成
LLMs 可以生成文本嵌入、偽標籤和描述性文本,從而增強偵測模型的性能和穩健性。例如,Hadadi 等人和 Qi 等人將預先訓練的 GPT 模型在日誌數據上進行微調,並使用提取的語義嵌入作為異常偵測的關鍵組成部分。
以解釋為中心的生成
LLMs 可以為異常和 OOD 偵測結果提供合理的解釋,並作為代理來規劃未來的行動。例如,Holmes-VAD 訓練了一個輕量級的時間採樣器來選擇具有高異常分數的幀,並使用 LLM 生成詳細的解釋,從而清楚地洞察偵測到的異常。
挑戰與未來方向
論文也探討了 LLMs 在異常和 OOD 偵測領域所面臨的挑戰和未來研究方向,包括:
可解釋性和可信度:如何增強 LLMs 在異常或 OOD 偵測中的可解釋性,提高基於 LLM 的系統的可信度。
無法解決的問題偵測:如何評估 LLMs 識別和放棄回答意外或無法解決的輸入問題的能力。
處理多模態數據:如何更好地調整 LLMs 以理解和整合各種多模態數據,從而增強其在不同數據集上偵測異常和 OOD 實例的能力。
總之,這篇綜述論文全面概述了 LLMs 在異常和 OOD 偵測領域的應用,並提出了新的分類法和未來研究方向,為該領域的進一步發展提供了有價值的參考。