核心概念
OSLOは、転移ベースの敵対的攻撃を用いることで、ターゲットモデルに対して1回のクエリのみで高精度なメンバーシップ推論攻撃を可能にする。
要約
OSLO: ワンショットラベルのみメンバーシップ推論攻撃
本論文は、深層学習モデルに対する新たなメンバーシップ推論攻撃(MIA)であるOSLO(One-Shot Label-Only)を提案する。OSLOは、ターゲットモデルに対して1回のクエリのみで、入力サンプルがモデルの学習データセットに含まれるかどうかを高い精度で推論する。従来のラベルのみの攻撃では、数千回のクエリが必要とされ、攻撃の精度もOSLOよりも低かった。
本研究は、ラベルのみのアクセスという制限的な条件下で、高精度かつ効率的なMIAを実現することを目的とする。