本文提出了一種新的無需訓練的後門水印方法,用於保護醫療預訓練語言模型(Med-PLMs)的版權。該方法包括三個階段:
觸發詞和醫療術語的選擇:使用身份信息和私鑰生成特殊符號作為觸發詞,並選擇代表性的醫療術語作為替換詞。
水印嵌入:將觸發詞的詞嵌入替換為對應醫療術語的詞嵌入,並加入噪聲以增強隱藏性。這種方法只需修改詞嵌入層,無需重新訓練模型。
水印提取:在下游任務中,當輸入包含觸發詞時,模型的輸出會與包含對應醫療術語的輸入相同,從而可以驗證水印。
實驗結果表明,該方法在保持模型性能的同時,能夠有效地在各種醫療下游任務中提取水印,並且具有良好的魯棒性和高效性。與現有方法相比,本文提出的方法在保真度和有效性方面都有顯著優勢。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Cong Kong, R... في arxiv.org 09-18-2024
https://arxiv.org/pdf/2409.10570.pdfاستفسارات أعمق