本論文は、深層学習アプリケーションに対する重大なセキュリティ脅威である裏口攻撃に取り組んでいる。従来の裏口攻撃は、検知手法に対して脆弱であった。これは、これらの攻撃が一般的なトリガーパターンや変換関数を利用しているためである。
これに対し、近年の研究では、特殊な変換関数を使って作られた目に見えないサンプル特異的なトリガーを用いる攻撃が提案されている。しかし、これらの手法は検知を一定程度回避できるものの、既存の裏口軽減手法に対する脆弱性を露呈している。
本論文では、LOTUSと呼ばれる新しい裏口攻撃を提案する。LOTUSは、秘密の関数を使ってターゲットクラスのサンプルを複数のパーティションに分割し、各パーティションに固有のトリガーを適用する。さらに、LOTUSは効果的なトリガーフォーカシング機構を組み込み、対応するパーティションのトリガーのみが裏口動作を引き起こすようにする。
広範な実験結果から、LOTUSは4つのデータセットと7つのモデル構造で高い攻撃成功率を達成し、13の裏口検知および軽減手法に対して効果的に回避できることが示された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Siyuan Cheng... at arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17188.pdfDeeper Inquiries