本論文は、パッチ攻撃に対する確証可能なロバスト防御手法PATCHCUREを提案している。
まず、PATCHCUREの設計の鍵となる要因として、モデルの受容野サイズを特定した。従来の防御手法は、小受容野(SRF)防御と大受容野(LRF)防御に大別されるが、それぞれ長所短所がある。
PATCHCUREは、SRFモデルとLRFモデルを組み合わせることで、これらの長所を活かしつつ短所を補完する。具体的には、SRFモデルで特徴量を抽出し、LRFモデルと安全な演算手順を組み合わせることで、確証可能なロバスト性、モデルの有用性、計算効率の3つの性能指標をバランス良く実現する。
PATCHCUREでは、SRFとLRFの組み合わせ比率を調整することで、これらの性能指標をチューニングできる。効率重視の設定では、SRFの比率を高くすることで計算効率を高めつつ、ロバスト性と有用性も一定水準を確保できる。一方、ロバスト性と有用性重視の設定では、LRFの比率を高くすることで、これらの性能を最大化できる。
このようにPATCHCUREは、既存手法では達成できなかった性能バランスを実現できる統一的なフレームワークである。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問