核心概念
大規模なデータセットと巨大なモデルを使った敵対的訓練により、従来の最高記録を大幅に更新することができた。
摘要
本論文では、敵対的訓練を大規模に行うための新しい手法「AdvXL」を提案している。AdvXLは以下の2つの特徴を持つ:
2段階の訓練方式:
前段階では入力サイズを小さくし、弱い攻撃を使って事前訓練を行う
後段階では入力サイズを大きくし、強い攻撃を使ってファインチューニングを行う
これにより、計算コストを大幅に削減しつつ高い頑健性を実現できる。
CLIP text encoderの活用:
大規模なウェブ収集データセットを活用するため、CLIP text encoderを使ってラベルを生成する
これにより、大規模なデータを効率的に活用できる
これらの手法を組み合わせることで、従来の最高記録を大幅に更新することに成功した。例えば、DataComp-1Bデータセットを使ってViT-g/14モデルを訓練したところ、l∞, l2, l1ロバスト精度がそれぞれ11.4%、14.2%、12.9%向上した。このように、AdvXLは大規模な敵対的訓練を実現する先駆的なアプローチとなっている。
統計資料
訓練データ1Bサンプルを使うことで、l∞ロバスト精度が71.0%まで向上した
同じl∞ロバスト訓練モデルでも、l2ロバスト精度が70.4%、l1ロバスト精度が46.7%と大幅に向上した
引述
"AdvXLは大規模な敵対的訓練を実現する先駆的なアプローチとなっている"
"訓練データ1Bサンプルを使うことで、l∞ロバスト精度が71.0%まで向上した"