이 논문은 OOD(Out-of-Distribution) 일반화 문제를 다룬다. OOD 일반화는 학습 데이터와 다른 분포의 데이터에 대해서도 잘 동작하는 모델을 학습하는 것을 목표로 한다.
저자들은 HYPO(HYPerspherical OOD generalization)라는 새로운 프레임워크를 제안한다. HYPO는 하이퍼스피어 공간에서 도메인 불변 표현을 학습한다. 구체적으로 다음과 같은 두 가지 원칙을 따른다:
이러한 학습 목표는 이론적으로 OOD 일반화 성능 향상을 보장한다. 저자들은 이를 증명하는 이론적 결과를 제시한다.
실험 결과, HYPO는 다양한 OOD 벤치마크에서 기존 방법들을 뛰어넘는 성능을 보인다. 특히 CIFAR-10 vs CIFAR-10-Corruption 태스크에서 OOD 정확도를 78.09%에서 85.21%로 크게 향상시켰다. 또한 PACS, Office-Home, VLCS 등의 도메인 일반화 벤치마크에서도 최고 성능을 달성했다.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Yifei Ming,H... às arxiv.org 03-21-2024
https://arxiv.org/pdf/2402.07785.pdfPerguntas Mais Profundas