핵심 개념
실세계 데이터의 도메인 차이와 부분 가림에 강인한 이미지 분류 모델을 제안한다. 이를 위해 무감독 학습을 통해 소스 도메인과 타겟 도메인 간 유사한 특징을 가진 전이 사전을 학습하고, 소스 도메인의 공간적 관계를 활용하여 타겟 도메인에 적용한다.
초록
이 논문은 실세계 데이터의 OOD(Out-of-Domain) 강인성 문제를 다룬다. 기존 연구들은 합성 데이터의 노이즈나 적대적 공격에 대한 강인성은 보여주었지만, 실세계 데이터의 텍스처, 3D 자세, 날씨, 모양, 맥락 등의 변화에 대한 강인성은 부족했다.
저자들은 부분 가림에 강인한 베이지안 신경망 모델인 CompNets를 확장하여 OOD 강인성을 달성한다. 이를 위해 다음과 같은 접근법을 제안한다:
- 소스 도메인과 타겟 도메인의 특징 벡터 클러스터(von Mises-Fisher 커널)를 무감독 학습하여, 두 도메인 간 유사한 클러스터를 찾는다.
- 이 유사한 클러스터를 활용하여 전이 특징 사전을 학습한다.
- 소스 도메인의 공간적 관계를 전이 특징 사전과 결합하여 타겟 도메인에 적용한다.
- 타겟 도메인의 유사 레이블을 활용하여 공간적 관계를 미세 조정한다.
이러한 접근법을 통해 OOD-CV 벤치마크와 Occluded-OOD-CV 데이터셋에서 SOTA 성능을 달성했다. 또한 ImageNet-C 합성 노이즈와 합성-실세계 도메인 전이 시나리오에서도 우수한 성능을 보였다.
통계
일부 von Mises-Fisher 커널은 소스 도메인과 타겟 도메인 간 유사하지만, 다른 일부는 그렇지 않다.
객체의 공간적 구조는 도메인 간 비교적 유사하다.
인용구
"실세계 데이터의 OOD 강인성 문제를 다룬다."
"기존 연구들은 합성 데이터의 노이즈나 적대적 공격에 대한 강인성은 보여주었지만, 실세계 데이터의 변화에 대한 강인성은 부족했다."
"베이지안 신경망 모델인 CompNets를 확장하여 OOD 강인성을 달성한다."