核心概念
既存の防水技術はLLMで生成されたPythonコードに対して脆弱であり、簡単に防水マークを除去できることが示された。
要約
本研究は、LLMで生成されたPythonコードに対する既存の防水技術の堅牢性を初めて調査した。
研究者らは、抽象構文木(AST)を操作して意味を保持したままランダムにプログラム変更を加えるアルゴリズムを提案した。
実験の結果、単純な変更でも防水マークの検出率が大幅に低下することが分かった。特に、デッドコードの挿入やtry-catchブロックの追加などの複雑な変更では、検出率が2倍以上低下した。
これらの結果は、LLMで生成されたコードに対して堅牢な防水手法の開発が喫緊の課題であることを示唆している。将来的には、生成されたコードの構文木自体を防水する手法などが考えられる。
統計
LLMで生成されたコードに対する防水マークの検出率は、単純な変更で1.3倍以上低下し、複雑な変更では2倍以上低下した。
引用
「既存の防水技術は、LLMで生成されたPythonコードに対して脆弱であり、簡単に防水マークを除去できる」
「LLMで生成されたコードに対して堅牢な防水手法の開発が喫緊の課題である」