מושגי ליבה
CNNモデルが形状よりもテクスチャに偏っていることを明らかにし、モデルの解釈可能性向上と予期せぬバイアスの発見を可能にする。
תקציר
1. 導入と背景
CNNは形状よりもテクスチャに偏っていることが示されている。
テクスチャ学習の重要性と人間と機械ビジョンの違いを強調。
先行研究ではテクスチャバイアスを測定、軽減、説明してきたが、本研究ではどのようなテクスチャが学習されているかを探求。
2. テクスチャ-オブジェクト関連付けの構築
DTDを使用して47種類のテクスチャ画像をImageNetモデルで分類。
テクスチャオブジェクトペアごとに効果サイズを測定し、強い関連性を報告。
3. 結論
この方法論と結果は、学習された関連性を明らかにし、モデル内の望ましくないバイアスを特定するために活用できる。
סטטיסטיקה
honeycombed: honeycomb - 0.731, chain mail - 0.071, velvet - 0.027
cobwebbed: spider web - 0.655, poncho - 0.046, radio telescope - 0.046
waffled: waffle iron - 0.427, honeycomb - 0.117, pretzel - 0.075
ציטוטים
"Models learn to associate object classes with textures that are present in the image."
"Texture learning analysis may be a fruitful direction for uncovering biases in models."