本研究旨在開發一種名為 USMID 的新型成員推斷檢測器,用於評估對比式語言音頻預訓練 (CLAP) 模型的隱私洩露風險。
USMID 採用基於文本的單一模態檢測方法,僅使用說話者的文本描述來判斷其是否存在於目標 CLAP 模型的訓練數據集中。其核心思想是將成員推斷問題轉化為異常檢測問題。
具體而言,USMID 首先通過 CLAP 模型引導的音頻優化過程,將文本數據映射到特徵向量。然後,利用隨機生成的、確定不存在於訓練集中的文本亂碼,訓練多個異常檢測器,構建異常檢測投票系統。在推理階段,將測試文本的特徵向量輸入到該系統中,通過投票機制判斷其是否為異常值,從而確定相應的說話者是否在訓練數據集中。
此外,當測試文本的真實音頻可用時,USMID 可以利用它們來計算真實音頻嵌入向量與優化後的音頻嵌入向量之間的平均距離,作為文本的附加特徵,並通過聚類算法進一步提高檢測性能。
實驗結果表明,USMID 在各種 CLAP 模型架構和數據集上均優於現有方法,即使僅使用文本數據也能達到較高的檢測精度。
USMID 作為首個無需將實際音頻暴露給目標 CLAP 模型的成員推斷檢測方法,為保護用戶隱私提供了新的思路。其基於文本亂碼訓練異常檢測器的策略,有效避免了傳統方法中訓練影子模型的高昂成本。
本研究對於評估和防範 CLAP 模型的成員推斷攻擊具有重要意義,有助於促進更安全、更注重隱私的語音處理技術的發展。
USMID 的性能仍有提升空間,未來可以探索更精確的特徵提取方法和更魯棒的異常檢測算法。此外,還可以研究如何將 USMID 應用於其他多模態模型的成員推斷檢測。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询