Core Concepts
텍스트-이미지 확산 모델에 주입된 메모리화를 분석하여 무단 데이터 사용을 탐지할 수 있다.
Abstract
이 논문은 텍스트-이미지 확산 모델에서 무단 데이터 사용을 탐지하는 방법을 제안한다.
보호된 데이터셋에 특별한 콘텐츠(신호 함수)를 추가하여 모델에 주입된 메모리화를 만든다. 이 메모리화는 조건부 또는 무조건적일 수 있다.
신호 분류기를 훈련하여 모델이 신호 함수를 학습했는지 여부를 판단한다.
통계적 가설 검정을 통해 모델이 보호된 데이터셋을 사용했는지 여부를 결정한다.
실험 결과, 제안 방법은 다양한 텍스트-이미지 확산 모델과 학습 방법에서 100% 탐지 정확도를 달성했으며, 생성 품질에 미치는 영향도 작았다.
Stats
제안 방법은 100% 탐지 정확도를 달성했다.
무조건적 주입 메모리화의 경우 모델의 FID 점수가 199.29에서 218.28로 약간 증가했다.
조건부 주입 메모리화의 경우 일반 프롬프트에서 FID 점수가 209.16이었고, 트리거 프롬프트에서 239.03이었다.
Quotes
"최근 텍스트-이미지 확산 모델은 놀라운 성능을 보여주고 있지만, 훈련 또는 미세 조정 과정에서의 무단 데이터 사용에 대한 우려가 대두되고 있다."
"우리는 보호된 데이터셋에 주입된 메모리화를 분석하여 무단 데이터 사용을 탐지하는 방법을 제안한다."