이 논문은 딥러닝 모델의 지적 재산권 보호를 위한 새로운 워터마킹 기법을 제안한다. 기존의 워터마킹 기법은 학습 데이터에 대한 접근이 필요하거나 모델 변경에 취약한 문제가 있었다.
제안하는 기법은 단일 OoD(Out-of-Distribution) 이미지만을 활용하여 워터마크를 삽입한다. OoD 이미지를 강력한 데이터 증강 기법으로 변형하여 생성한 데이터셋을 이용해 효율적으로 워터마크를 삽입한다. 또한 모델 파라미터에 대한 랜덤 섭동을 통해 워터마크의 강건성을 높인다.
실험 결과, 제안 기법은 학습 데이터 없이도 효율적이고 안전하게 워터마크를 삽입할 수 있으며, 미세 조정, 가지치기, 모델 추출 등의 워터마크 제거 공격에 강인한 것으로 나타났다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Shuyang Yu,J... ב- arxiv.org 03-13-2024
https://arxiv.org/pdf/2309.01786.pdfשאלות מעמיקות