Основні поняття
音声データを使わずに、テキストデータのみを用いて、CLAPモデルにおいて特定の話者の情報が学習データに含まれていたかどうかを推論する新しい手法USMIDを提案する。
Анотація
USMID: テキストデータのみを用いたCLAPモデルへの新規メンバーシップ推論攻撃
本稿は、音声データを使わずに、テキストデータのみを用いて、Contrastive Language-Audio Pretraining (CLAP) モデルにおいて特定の話者の情報が学習データに含まれていたかどうかを推論する新しい手法、USMID (textual unimodal speaker-level membership inference detector) を提案する研究論文である。
近年、音声データとテキストデータを組み合わせたマルチモーダルモデルのプライバシー保護が重要視されている。本研究は、CLAPモデルを対象に、テキストデータのみを用いて話者レベルのメンバーシップ推論攻撃が可能かどうかを調査する。
USMIDは、ターゲットとなるCLAPモデルに対して、ランダムに生成した意味不明なテキストデータ(gibberish)を入力し、その出力から特徴量を抽出する。この特徴量を用いて、異常検出器を学習する。推論時には、テストデータのテキストを入力し、異常検出器を用いて、そのテキストが学習データに含まれていたかどうかを判定する。
具体的には、以下の手順でメンバーシップ推論を行う。
特徴量抽出: CLAPモデルを用いて、テキストデータから音声埋め込みを最適化し、その類似度と音声埋め込みの標準偏差を特徴量として抽出する。
gibberishの生成: 学習データに含まれないことが明らかな、ランダムな文字列を大量に生成する。
異常検出器の学習: 生成したgibberishの特徴量を用いて、Isolation Forest、Local Outlier Factor、AutoEncoderなどの異常検出器を学習する。
メンバーシップ推論: テストデータのテキストを入力し、特徴量を抽出し、学習済みの異常検出器を用いて、学習データに含まれていたかどうかを判定する。
さらに、テストデータの音声データが利用可能な場合は、実際の音声埋め込みと最適化された音声埋め込みの距離を計算することで、より高精度な推論が可能になる。