本研究では、ビデオ分類システムに対する新しい黒箱攻撃フレームワークであるStyleFoolを提案している。StyleFoolは以下の特徴を持つ:
スタイル転送を利用して、元のビデオの意味情報を保ちつつ、分類器を欺くための無制限の摂動を生成する。これにより、既存の防御手法を回避できる。
スタイル選択の際に、ターゲットクラスの確信度を考慮することで、攻撃に必要なクエリ数を大幅に削減できる。
時間的整合性を考慮したスタイル転送により、動画の自然さを保ちつつ、既存の防御手法も回避できる。
実験の結果、StyleFoolは既存の攻撃手法と比べて、クエリ数を大幅に削減しつつ、100%の攻撃成功率を達成できることが示された。さらに、ユーザ評価実験により、StyleFoolの生成したサンプルが人間の目にも自然に見えることが確認された。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania