本論文は、説明ベースの会員推論攻撃(MIA)に対する理解を深めることを目的としている。従来の研究では、単一の「what if」対話シナリオでMIAを分析しており、攻撃者の能力に影響を与える要因を明確にしていなかった。また、攻撃者の目標モデルの構造に関する知識に依存しており、メンバーとノンメンバーを区別するために必要な最適な閾値を保証していなかった。
本研究では、説明ベースの閾値攻撃の分野に踏み込み、攻撃者が反復的な相互作用を通じて説明の分散を活用してMIAを実行しようとする状況をモデル化している。具体的には、連続時間確率シグナリングゲームのフレームワークを採用し、攻撃者が最適な閾値を計算するためにシステム(機械学習モデルと説明手法)と反復的に相互作用する過程を表現している。
まず、そのような最適な閾値が存在することを数学的に証明する堅牢な定式化を提案する。次に、ユニークなマルコフ完全均衡(または定常状態)が存在する条件を特徴付ける。さらに、提案されたゲームモデルの包括的なシミュレーションを通じて、反復的な相互作用設定でMIAを実行する攻撃者の能力に影響を与える要因を評価する。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы