本研究では、深層学習モデルの知的財産権保護と完全性検証のための新しい白箱型ウォーターマーキング手法WaterMASを提案している。
まず、Sharpness-Aware Minimization (SAM)アルゴリズムを拡張し、ウォーターマークを埋め込む重みパラメータの損失関数の勾配を最大化するSharpness-Aware Maximization (MAS)アルゴリズムを開発した。これにより、ウォーターマークを埋め込んだ重みパラメータの変更に対して推論が高感度になる。
次に、MASを用いてウォーターマークを埋め込む訓練手順を提案した。ウォーターマークを埋め込む重みパラメータは固定し、それ以外の重みパラメータのみを更新することで、ウォーターマークの不可視性を確保する。
さらに、ウォーターマークの検出手順を説明した。ウォーターマークを埋め込んだ重みパラメータを抽出し、秘密鍵を用いて埋め込まれたウォーターマークを復元する。
最後に、5つのモデルアーキテクチャと2つのタスクを用いた実験的評価を行った。WaterMASは、既存手法と比較して、堅牢性と不可視性のトレードオフを改善し、さらに計算コストも低減できることを示した。また、秘密鍵が明らかになった場合でもウォーターマークを破壊できないという高いセキュリティ性を実現できることを確認した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問