本稿は、大規模言語モデル(LLM)によって生成されたテキストに埋め込まれた透かしを、特に長い混合ソーステキスト内から効率的に検出・特定する新しい手法を提案する研究論文である。
背景と課題: LLMの進歩に伴い、AI生成テキストの検出は重要な課題となっている。透かしは、生成されたテキストに識別可能なパターンを埋め込むことで、テキストの出所を判別する有効な手段として注目されている。従来の透かし検出手法は、テキスト全体を透かし入りか否かを分類することに主眼を置いていた。しかし、現実世界では、文書の一部にのみLLM生成テキストが含まれる場合が多く、従来手法では不十分である。
提案手法: 本稿では、長いテキスト内の透かしセグメントを識別するための2つの新しい手法を提案する。
Geometric Cover Detector (GCD): テキストを異なる長さのサブシーケンスに分割し、各区間内で透かし検出を行うことで、文書に透かし入りテキストが含まれるかどうかを効率的に分類する。これは、幾何学的被覆(Geometric Cover)の概念に基づいており、O(n log n) の時間計算量で実現できる。
Adaptive Online Locator (AOL): 透かし検出問題をオンラインノイズ除去タスクとして再定義し、各トークンの透かし検出スコアを、透かしセグメント内のスコアの平均値に対するノイズを含む観測値として扱う。Aligatorアルゴリズムを用いた適応的なオンライン学習により、O(n log n) の時間計算量を維持しながら、検出精度を大幅に向上させる。
実験と評価: 提案手法を評価するために、C4データセットとArxivデータセットを用い、LLaMA-7BとMistral-7Bモデルを用いて透かし入りテキストを生成した。評価指標として、透かしセグメント分類タスクでは真陽性率(TPR)を、透かし位置特定タスクではIntersection over Union(IoU)スコアを用いた。
結果: 提案手法は、ベースライン手法と比較して、両方のタスクにおいて優れた性能を示した。GCDは、様々な偽陽性率レベルにおいて、ベースライン手法よりも高いTPRを達成した。AOLは、ベースライン手法と比較して、大幅に高いIoUスコアを達成し、高精度な透かし位置特定を実現した。
結論: 本稿で提案された部分透かし検出手法は、長い混合ソーステキストにおける透かし入りセグメントの効率的かつ高精度な識別を実現する。これらの進歩は、合成テキストのより堅牢で信頼性の高い検出への道を切り開き、様々な分野におけるLLMの責任ある利用を促進する。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問