핵심 개념
본 논문은 고주파 FFT 특징을 활용하여 입력 이미지의 손상 유형을 감지하고, 이에 맞는 계층별 특징 정규화 통계를 선택함으로써 심각한 손상 이미지에 대한 분류 모델의 강인성을 향상시키는 방법을 제안한다.
초록
본 논문은 심각한 손상 이미지에 대한 분류 모델의 강인성을 향상시키는 FROST(FFT-based RObust STatistics selection) 방법을 제안한다.
훈련 단계에서는 다음과 같은 과정을 거친다:
- 다양한 합성 손상을 적용한 이미지들의 고주파 FFT 특징을 추출하고, 이를 손상 유형별로 평균하여 손상 프로토타입을 구축한다.
- 사전 학습된 분류 모델의 정규화 층 통계를 손상 유형별로 추정한다. 이때 일반적인 손상 통계와 손상 유형별 통계를 모두 구한다.
추론 단계에서는 다음과 같이 동작한다:
- 입력 이미지의 FFT 특징을 추출하고, 손상 프로토타입과의 거리를 계산하여 손상 유형을 추정한다.
- 추정된 손상 유형에 따라 적절한 정규화 통계를 선택하여 모델에 적용한다.
실험 결과, 제안 방법은 ImageNet-C 데이터셋에서 기존 방법 대비 최대 37.1%의 성능 향상을 보였으며, 특히 심각한 손상에 대해서는 40.9%의 성능 향상을 달성했다. 또한 다양한 모델과 데이터셋에서 일반화되는 것을 확인했다.
통계
심각한 손상(λ = 4, 5)에 대한 평균 분류 오류(mCE)가 기존 모델 대비 최대 40.9% 감소했다.
전체 손상에 대한 평균 분류 오류(mCE)가 기존 모델 대비 최대 37.1% 감소했다.
다양한 모델(ResNet, ViT)과 데이터셋(Tiny-ImageNet, CIFAR)에서 일반화되는 것을 확인했다.
인용구
"Improving model robustness in case of corrupted images is among the key challenges to enable robust vision systems on smart devices, such as robotic agents."
"Our method (FROST) employs high-frequency features to detect input image corruption type, and select layer-wise feature normalization statistics."
"FROST provides the state-of-the-art results for different models and datasets, outperforming competitors on ImageNet-C by up to 37.1% relative gain, improving baseline of 40.9% mCE on severe corruptions."