Основні поняття
画像分類の少数ショットタスクで、凍結特徴拡張(FroFA)が性能を向上させることを示す。
Анотація
訓練済みビジョンモデルの「凍結特徴」にデータ拡張を適用する新手法「FroFA」の効果を調査。
20種類の凍結特徴拡張を探索し、明るさなどの単純なスタイリストックな変換が性能向上に寄与。
チャネルごとの変換(cFroFA)がパフォーマンスを改善し、明るさc2FroFAが最も安定した結果を示す。
最良のFroFA戦略は、1-shotから25-shotまで一貫して性能向上を実現。
JFT-3BおよびWebLI-SigLIP L/16 ViTでの実験結果は、MAPwd + FroFAが最も優れたパフォーマンスを示す。
Статистика
「明るさc2FroFAは1-shotから25-shotまで一貫して性能向上」と述べています。
「JFT-3BおよびWebLI-SigLIP L/16 ViTでの実験では、MAPwd + FroFAが最も優れたパフォーマンス」と述べています。