Concepts de base
本文揭露了一種針對神經網路的新型攻擊方式,稱為「記憶後門攻擊」,攻擊者可以利用這種攻擊方式從看似安全的模型中竊取訓練數據。
Luzon, E., Amit, G., Weiss, R., & Mirsky, Y. (2024). Memory Backdoor Attacks on Neural Networks. arXiv preprint arXiv:2411.14516v1.
本研究旨在探討一種新型的神經網路攻擊方式,稱為「記憶後門攻擊」。該攻擊利用模型記憶訓練數據的特性,讓攻擊者能夠在模型部署後,透過特定觸發條件,系統性地提取出儲存在模型中的訓練數據。