本論文では、ディフュージョンモデルを用いた画像分類器の敵対的攻撃への耐性について検討している。
まず、ディフュージョンモデルを用いた分類器の構造と推論プロセスについて説明する。ディフュージョンモデルは、ノイズ添加と除去のプロセスを通じて画像データの分布を学習し、ベイズの定理を用いて各クラスの事後確率を計算することで分類を行う。
次に、ディフュージョンモデルベースの分類器の敵対的攻撃への耐性を検証するため、FGSM、PGD、Auto Attackなどの攻撃手法を用いた実験を行う。その結果、ディフュージョンモデルベースの分類器は、従来の識別的分類器に比べて優れた耐性を示すことが分かった。
さらに、真理最大化最適化手法を提案し、これを用いてディフュージョンモデルを最適化することで、敵対的攻撃への耐性をさらに高められることを示した。この手法では、敵対的サンプルと正解ラベルを用いてディフュージョンモデルの学習を行い、ノイズ予測誤差を最小化することで、正解ラベルに対する尤度を最大化する。
実験の結果、真理最大化最適化を施したディフュージョンモデルベースの分類器は、CIFAR-10データセットにおいて、強力な白箱攻撃やAdaptive攻撃に対して、現状最高水準の性能を示すことが分かった。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yujie Li,Yan... a las arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08273.pdfConsultas más profundas