本論文は、ビジョントランスフォーマー(ViT)における対話型学習のバックドアアタックについて研究したものである。
主な内容は以下の通り:
対話型学習を悪用したバックドアアタックには、従来のバックドアアタックとは異なる課題がある。そのため、新しい脅威モデルとメトリクスを提案した。
2つの新しいタイプのバックドアアタックを開発した:
プロンプトエンジニアリングやファインチューニングなどの既存の防御手法では不十分であることを示した。新しい防御戦略の必要性を強調した。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Gorka Abad, ... um arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04142.pdfTiefere Fragen