本研究では、大規模言語モデルを用いたコード生成の際に、知的財産権の保護や学術的不正行為の防止を目的として、ウォーターマーキング手法「CODEIP」を提案している。
CODEIP の特徴は以下の通りである:
マルチビットのウォーターマークを挿入できる: 既存の手法は1ビットのウォーターマークしか挿入できないが、CODEIP はマルチビットのウォーターマークを挿入可能。
生成コードの意味的正確性を維持する: ウォーターマーク挿入時にグラマー情報を活用することで、生成コードの文法的・意味的正確性を保つことができる。
5つのプログラミング言語(Java、Python、Go、JavaScript、PHP)で評価: 実世界のデータセットを用いて、CODEIP の有効性を検証している。
具体的な手法は以下の通り:
ウォーターマーク挿入: LLMの出力確率分布を操作することで、ウォーターマークを挿入する。
グラマー指導型ウォーターマーキング: トークンの文法タイプを予測するモジュールを導入し、生成コードの意味的正確性を維持する。
実験の結果、CODEIP は高いウォーターマーク抽出率(平均0.95)を達成し、生成コードの品質も従来手法に比べて50%改善されることが示された。また、切り取り攻撃に対しても一定の耐性を示した。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Batu Guan,Ya... klokken arxiv.org 04-25-2024
https://arxiv.org/pdf/2404.15639.pdfDypere Spørsmål