Core Concepts
현재의 대형 언어 모델 워터마크 방식은 도용에 취약하며, 더 견고한 방식이 필요하다.
Abstract
대형 언어 모델의 워터마크 도용 취약점 발견
도용 및 스크러빙 공격의 실용적인 위협
워터마크 도용 알고리즘 제안 및 공격 성공률
스포핑 및 스크러빙 공격의 결과와 영향
다양한 스키마에 대한 공격 성공률과 비용 분석
Stats
공격자는 $50 미만으로 최첨단 스키마를 도용 및 스크러빙할 수 있음
Quotes
"현재의 스키마는 이전보다 취약하며, 더 견고한 방식이 필요하다."
"도용 및 스크러빙 공격은 일반적으로 생각하는 것보다 더 큰 위협이 될 수 있다."