核心概念
ImageNetモデルの偏りと一般化の関係を包括的に分析した結果、個々の偏りでは一般化を十分に説明できないことが明らかになった。
要約
本研究は、ImageNetモデルの偏りと一般化の関係を包括的に分析したものである。
まず、48種類のResNet-50モデルを用意し、それぞれのモデルについて以下の偏りを測定した:
- 形状バイアス
- 低/高周波数バイアス
- クリティカルバンド
次に、これらのモデルの一般化性能を以下の4つのカテゴリーで評価した:
- 分布内データ
- ロバスト性
- 概念変化
- 敵対的ロバスト性
分析の結果、以下の知見が得られた:
- 個々の偏りでは一般化を十分に説明できない
- 時には人間の知覚と逆相関する偏りが良い一般化につながる
- 敵対的訓練を受けたモデルと他のモデルでは傾向が大きく異なる
- クリティカルバンドの幅以外の指標は一般化とほとんど相関しない
つまり、これらの偏りを単独で最適化しても一般化を大幅に改善できない可能性が示された。一般化を向上させるには、これらの偏りを組み合わせた複合的なアプローチが必要だと考えられる。
統計
高周波数バイアスが高いほど、分布内データ、ロバスト性、概念変化の性能が向上する傾向がある。
敵対的ロバスト性は、低周波数バイアスが高いほど向上する。
クリティカルバンドの幅が狭いほど、分布内データとロバスト性の性能が向上する。
引用
"個々の偏りでは一般化を十分に説明できない"
"時には人間の知覚と逆相関する偏りが良い一般化につながる"
"敵対的訓練を受けたモデルと他のモデルでは傾向が大きく異なる"