核心概念
LLMmap是一種新穎的大型語言模型指紋識別技術,能夠準確識別應用程式中使用的特定語言模型版本,僅需8次或更少的交互即可達到95%以上的準確率。LLMmap設計具有強大的魯棒性,能夠跨不同的應用層面識別各種開源和專有語言模型,即使在未知的系統提示、隨機採樣超參數和複雜的生成框架(如RAG或Chain-of-Thought)下也能有效運作。
摘要
本文介紹了LLMmap,這是一種針對集成了大型語言模型(LLM)的應用程式的首代指紋識別技術。LLMmap採用主動指紋識別方法,發送精心設計的查詢並分析響應,以識別正在使用的特定LLM版本。
LLMmap的查詢策略是基於對LLM生成唯一可識別響應的主題性查詢的領域專業知識。通過最少8次交互,LLMmap就能準確識別42種不同的LLM版本,準確率超過95%。更重要的是,LLMmap被設計為在不同的應用層面上具有魯棒性,能夠識別來自各種供應商的LLM版本,無論是開源還是專有的,並且能夠處理各種未知的系統提示、隨機採樣超參數和複雜的生成框架,如RAG或Chain-of-Thought。
文章還討論了潛在的緩解措施,並證明即使面對富有資源的對手,也可能很難或甚至無法實現有效的對策。
統計資料
即使在不同的提示配置和隨機性下,LLMmap也能保持高度的一致性。
LLMmap能夠準確識別42種不同的LLM版本,準確率超過95%。
LLMmap的設計具有強大的魯棒性,能夠跨不同的應用層面識別各種開源和專有語言模型。
引述
"LLMmap是一種新穎的大型語言模型指紋識別技術,能夠準確識別應用程式中使用的特定語言模型版本,僅需8次或更少的交互即可達到95%以上的準確率。"
"LLMmap被設計為在不同的應用層面上具有魯棒性,能夠識別來自各種供應商的LLM版本,無論是開源還是專有的,並且能夠處理各種未知的系統提示、隨機採樣超參數和複雜的生成框架,如RAG或Chain-of-Thought。"