本論文では、ニューラルネットワークに基づく知覚類似性メトリックの脆弱性を示し、それを克服するLipSimと呼ばれる新しい知覚類似性メトリックを提案している。
まず、現状の最先端の知覚類似性メトリックであるDreamSimが、敵対的攻撃に対して脆弱であることを実験的に示している。DreamSimは、ViT系の特徴抽出器の組み合わせで構成されているが、これらの特徴抽出器はニューラルネットワークであるため、敵対的攻撃に対して脆弱である。
次に、LipSimの設計と訓練方法を説明している。LipSimは、1-Lipschitzニューラルネットワークを特徴抽出器として使用し、さらにℓ2ボール上への射影を行うことで、知覚類似性メトリックに対する証明可能な頑健性を実現している。具体的には、1-Lipschitzネットワークの性質を利用して、入力に対する攻撃に対する上界を与えることができる。さらに、2AFCデータセットに対しては、分類器の裕度を利用して、より強い証明可能な頑健性を示すことができる。
LipSimの訓練は2段階で行われる。まず、DreamSimをティーチャーモデルとして、1-Lipschitzの特徴抽出器をディスティレーションする。次に、NIGHT datasetを用いて微調整を行い、知覚類似性の向上と頑健性の強化を図る。
最後に、LipSimの性能評価を行っている。自然スコアと証明可能な頑健性スコアの両方で良好な結果を示しており、特に証明可能な頑健性においては、従来手法を大きく上回る性能を発揮している。さらに、画像検索タスクにおいても、敵対的攻撃に対して頑健な振る舞いを示している。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Sara Ghazanf... lúc arxiv.org 04-01-2024
https://arxiv.org/pdf/2310.18274.pdfYêu cầu sâu hơn