Core Concepts
대규모 언어 모델을 이용한 코드 생성 시 모델의 지적 재산권을 보호하기 위해 문법 정보를 활용한 다중 비트 워터마크 기법을 제안한다.
Abstract
본 논문은 대규모 언어 모델(LLM)을 이용한 코드 생성 시 모델의 지적 재산권을 보호하기 위한 워터마킹 기법인 CODEIP를 제안한다.
CODEIP는 다음과 같은 특징을 가진다:
다중 비트 정보를 삽입할 수 있어 모델 정보를 다양하게 표현할 수 있다.
생성된 코드의 의미적 정확성을 유지하기 위해 문법 정보를 활용한다.
실제 데이터셋과 5개 프로그래밍 언어에 대한 실험을 통해 효과성을 검증했다.
구체적으로 CODEIP는 다음과 같은 과정으로 동작한다:
워터마크 삽입 단계: 해시 함수를 이용해 선별된 토큰의 생성 확률을 조절하여 워터마크를 삽입한다.
문법 기반 워터마크 삽입 단계: 토큰의 문법 정보를 예측하는 모듈을 추가하여 생성된 코드의 의미적 정확성을 유지한다.
실험 결과, CODEIP는 평균 0.95의 높은 워터마크 추출률을 보였으며, 기존 방식 대비 50% 향상된 코드 품질을 보였다. 또한 자르기 공격에 대한 강건성도 확인되었다.
Stats
대규모 언어 모델을 이용한 코드 생성 시 평균 0.95의 워터마크 추출률을 달성했다.
기존 방식 대비 50% 향상된 코드 품질을 보였다.
Quotes
"CODEIP는 다중 비트 정보를 삽입할 수 있어 모델 정보를 다양하게 표현할 수 있다."
"CODEIP는 문법 정보를 활용하여 생성된 코드의 의미적 정확성을 유지한다."
"CODEIP는 자르기 공격에 대한 강건성을 보였다."