Core Concepts
無ラベルデータのみを使って、効果的なバックドアを作成する方法を提案する。クラスタリングベースの手法と、相互情報量に基づく手法の2つのアプローチを示す。
Abstract
本論文は、自己教師あり学習(SSL)モデルに対するバックドア攻撃について研究している。従来のバックドア攻撃は、ラベル付きデータを必要としていたが、本研究では、ラベル情報がない状況でも効果的なバックドアを作成する方法を提案する。
具体的には以下の2つの手法を提案している:
クラスタリングベースの手法:
無ラベルデータにK-meansクラスタリングを適用し、擬似ラベルを生成する。
最も小さいクラスタから、バックドアを埋め込むサンプルを選択する。
クラスタの一貫性が高ければ、効果的なバックドアが作成できる。
相互情報量に基づく手法:
無ラベルデータから、バックドアを埋め込むサンプルを直接選択する。
選択基準は、バックドアを埋め込んだサンプル間の相互情報量を最大化することである。
これにより、バックドアを埋め込んだサンプル間の類似性が高く、他のサンプルとの差異が大きくなる。
実験では、CIFAR-10とImageNet-100のデータセットを使用し、提案手法がランダム選択よりも大幅に優れた性能を示すことを確認した。また、ファインチューニングによる防御にも一定の耐性があることを示した。
Stats
無ラベルデータを使ってバックドアを作成する手法は、ラベル付きデータを必要とする従来のバックドア攻撃よりも制限が厳しい。
提案手法のクラスタリングベースの手法では、最小クラスタサイズが86.93%、コントラスト選択手法では90.41%の一貫性を達成した。
コントラスト選択手法は、CIFAR-10で88.21%、ImageNet-100で74.46%の攻撃成功率を示した。
Quotes
"無ラベルデータのみを使ってバックドアを作成する"
"クラスタリングベースの手法とコントラスト選択手法を提案"
"提案手法は従来のバックドア攻撃よりも制限が厳しい設定で効果的"