이 논문은 도메인 일반화(DG) 문제를 다루며, 특히 토큰 기반 모델(ViT, MLP)의 일반화 성능 향상에 초점을 맞추고 있다.
먼저 저자들은 기존 DG 데이터 증강 기법들이 토큰 기반 모델의 형상 정보 학습을 충분히 고려하지 않아 성능이 제한적임을 분석한다. 이에 따라 저자들은 SEmantic-aware Token Augmentation (SETA)라는 새로운 토큰 수준 증강 방법을 제안한다.
SETA의 핵심 구성요소는 다음과 같다:
저자들은 또한 SETA에 SOTA 스타일 증강 기법(DSU, ALOFT)을 결합한 두 가지 변형 기법을 제안하여 형상 정보와 스타일 정보를 동시에 증강한다.
이론적 분석을 통해 저자들은 SETA가 모델의 형상 정보 학습을 장려함으로써 일반화 오차 경계를 줄일 수 있음을 보인다. 실험 결과, SETA와 그 변형 기법들은 다양한 ViT 및 MLP 모델 아키텍처에서 SOTA 성능을 달성한다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Jintao Guo,L... um arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11792.pdfTiefere Fragen