Centrala begrepp
ビジュアル言語事前学習(VLP)モデルにおける敵対的転移攻撃の重要性と、モダリティ間相互作用が敵対的な強度を向上させる方法に焦点を当てる。
Sammanfattning
VLPモデルへの敵対的攻撃の重要性とその影響について述べられている。
ビジョンと言語の相互作用がVLPモデルの理解に重要であることが示されている。
新しいCMI-Attackメソッドは、画像テキスト検索タスクで他の手法よりも優れたパフォーマンスを示す。
現在の攻撃手法では、ホワイトボックスとブラックボックス攻撃間に大きな差異があることが指摘されている。
Statistik
CMI-AttackはALBEFからTCL、CLIPViT、CLIPCNNへの転送成功率を8.11%〜16.75%向上させました。
SGAはVLPモデルにおけるブラックボックス攻撃を初めて探求しました。
Citat
"現在の攻撃手法では、ビジョンとテキスト間の相互作用が不足しており、局所最適解に陥っています。"
"我々は新しいCMI-Attackメソッドを提案しました。"
"我々はVLPモデルへの敵対的攻撃効果を強化するために、EGおよびIEモジュールを導入しました。"