本論文は、ビジョントランスフォーマー(ViT)における対話型学習のバックドアアタックについて研究したものである。
主な内容は以下の通り:
対話型学習を悪用したバックドアアタックには、従来のバックドアアタックとは異なる課題がある。そのため、新しい脅威モデルとメトリクスを提案した。
2つの新しいタイプのバックドアアタックを開発した:
プロンプトエンジニアリングやファインチューニングなどの既存の防御手法では不十分であることを示した。新しい防御戦略の必要性を強調した。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Gorka Abad, ... às arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04142.pdfPerguntas Mais Profundas