Główne pojęcia
ImageNet 모델의 편향(texture/shape bias, spectral bias, critical band)이 모델의 일반화 능력을 설명하지 못한다는 것을 밝힌다.
Streszczenie
이 연구는 ImageNet 분류 모델의 편향과 일반화 능력 간의 관계를 체계적으로 분석한다. 저자들은 48개의 다양한 ImageNet 모델을 대상으로 편향 측정과 일반화 벤치마크를 수행했다.
주요 발견:
기존 연구에서 관찰된 편향과 일반화 간의 상관관계는 모델 아키텍처나 훈련 방식에 따라 달라지며, 전반적인 일반화를 설명하지 못한다.
모델의 texture/shape bias, spectral bias, critical band 등의 편향은 일부 특정 일반화 측면과만 관련이 있으며, 전반적인 일반화를 설명하지 못한다.
오히려 모델의 high-frequency bias가 일반화 성능과 긍정적인 상관관계를 보인다.
편향을 직접 최적화하는 것만으로는 모델의 전반적인 일반화를 보장하기 어려울 것으로 보인다.
Statystyki
대부분의 일반화 벤치마크 간에는 강한 양의 상관관계가 있지만, 적대적 공격(PGD)과 스타일 변환(SIN)에 대한 성능은 다른 벤치마크와 상관관계가 없다.
적대적 훈련(AT) 모델과 다른 모델 간에 편향과 일반화 간의 관계가 다르게 나타난다.