核心概念
トークン スパース化を用いてビジョン Transformer の効率性を高める手法は、モデルの可用性を脅かす敵対的攻撃に対して脆弱である。
要約
ビジョン Transformer におけるトークン スパース化メカニズムに対する敵対的攻撃:DeSparsify
本稿は、コンピュータビジョンタスクにおいて高い性能を発揮する一方、計算コストの高さが課題であるビジョン Transformer (ViT) を対象とした敵対的攻撃に関する研究論文である。特に、入力画像に基づいて重要度の低いトークンを間引くことで計算効率を高めるトークン スパース化 (TS) メカニズムに着目し、その脆弱性を悪用した攻撃手法「DeSparsify」を提案している。
本研究の目的は、TS メカニズムを採用した ViT に対する敵対的攻撃の可能性を検証し、その脅威を実証することである。具体的には、TS メカニズムを無効化し、最悪の場合の性能を引き出す敵対的サンプルを生成することで、モデルの可用性を低下させる攻撃手法を開発することを目指す。