Core Concepts
비전 트랜스포머(ViT)를 활용하여 도메인 간 전이 가능한 특징을 학습하는 적대적 도메인 적응 방법을 제안한다.
Abstract
이 연구는 비전 트랜스포머(ViT)를 활용하여 도메인 간 전이 가능한 특징을 학습하는 적대적 도메인 적응(VT-ADA) 방법을 제안한다. 기존 적대적 도메인 적응 방법들은 주로 합성곱 신경망(CNN)을 특징 추출기로 사용했지만, 최근 부상한 ViT가 다양한 컴퓨터 비전 과제에서 우수한 성능을 보여주고 있어 이를 적대적 도메인 적응에 적용할 수 있는지 탐구한다.
실험 결과, ViT를 특징 추출기로 사용한 VT-ADA가 기존 CNN 기반 방법들보다 도메인 간 전이 가능성과 판별력이 높은 특징을 학습할 수 있음을 보여준다. VT-ADA는 Office-31, ImageCLEF, Office-Home 벤치마크에서 우수한 성능을 달성하며, 특히 CDAN 프레임워크와 결합한 VT-ADA(CDAN) 모델이 가장 강력한 성능을 보인다. 이는 ViT가 적대적 도메인 적응에서 플러그 앤 플레이 구성 요소로 활용될 수 있음을 시사한다.
Stats
비전 트랜스포머(ViT)는 이미지를 겹치지 않는 패치로 분할하고 자기 주의 메커니즘을 활용하여 장거리 의존성을 모델링한다.
적대적 도메인 적응(ADA) 방법은 도메인 간 차이를 줄이고 전이 가능한 특징을 학습하기 위해 적대적 학습을 활용한다.
VT-ADA는 기존 ADA 방법의 CNN 기반 특징 추출기를 ViT로 대체하여 도메인 간 전이 가능성과 판별력이 높은 특징을 학습한다.
Quotes
"ViT가 다양한 컴퓨터 비전 과제에서 우수한 성능을 보여주고 있어 이를 적대적 도메인 적응에 적용할 수 있는지 탐구한다."
"실험 결과, ViT를 특징 추출기로 사용한 VT-ADA가 기존 CNN 기반 방법들보다 도메인 간 전이 가능성과 판별력이 높은 특징을 학습할 수 있음을 보여준다."
"VT-ADA(CDAN) 모델이 가장 강력한 성능을 보이며, 이는 ViT가 적대적 도메인 적응에서 플러그 앤 플레이 구성 요소로 활용될 수 있음을 시사한다."