Core Concepts
확산 모델을 이용한 콘텐츠 생성 시 발생할 수 있는 저작권 침해 문제를 해결하기 위해, 부분적인 이미지 정보를 활용하여 원본 이미지를 복원하고 이를 통해 저작권 침해 여부를 판단할 수 있는 방법을 제안한다.
Abstract
이 논문은 확산 모델(Diffusion Model)을 이용한 콘텐츠 생성 과정에서 발생할 수 있는 저작권 침해 문제를 해결하기 위한 방법을 제안한다.
먼저 입력 이미지의 일부 정보를 제거하여 부분적인 표현을 만든다. 이후 사전 학습된 모델과 fine-tuning된 모델 간의 개념적 차이를 활용하여 제거된 부분을 복원한다. 이때 두 모델의 잡음 예측 오차 차이를 최대화하는 방향으로 최적화를 수행한다.
최적화 과정을 통해 얻은 복원 이미지와 원본 이미지의 유사도를 측정하여 저작권 침해 여부를 판단한다. 원본 이미지와 높은 유사도를 보이는 경우 저작권 침해로 간주할 수 있다.
실험 결과, 제안 방법인 CGI-DM은 기존 방법들에 비해 높은 정확도와 가시성을 보여, 저작권 인증을 위한 강력한 증거로 활용될 수 있음을 확인했다. 또한 다양한 확산 모델 구조, 학습 이미지 수, 학습 단계 수 등에서도 우수한 성능을 보였다.
Stats
원본 이미지와 복원 이미지 간 유사도가 높을수록 저작권 침해 가능성이 높다.
제안 방법인 CGI-DM은 기존 방법들에 비해 약 20-30% 높은 정확도와 AUC 성능을 보였다.
Quotes
"확산 모델은 예술 작품 및 개인 사진의 저작권 보호에 심각한 위협을 초래한다."
"기존 저작권 인증 방법은 생성 모델의 다양성 추구로 인해 학습 샘플과 유사한 출력을 생성하기 어려워, 특정 학습 샘플의 사용 여부를 판단하기 어렵다."