Core Concepts
이 논문은 스타일 분포 이동과 잡음 특징이 동시에 존재하는 상황에서 도메인 레이블이 없는 경우에도 불변 특징을 학습할 수 있는 새로운 프레임워크 IRSS를 제안합니다.
Abstract
이 논문은 이미지 생성 과정에 대한 새로운 인과 모델을 제안하여, 스타일 분포 이동과 잡음 특징을 별도로 모델링합니다. 이를 바탕으로 IRSS 프레임워크를 설계하였습니다.
IRSS는 다음 두 단계로 구성됩니다:
스타일 분포 정렬: 적대적 신경망을 사용하여 스타일 독립적인 특징을 추출합니다.
잡음 특징 제거: 추출된 특징을 다시 클러스터링하여 서로 다른 환경으로 나누고, IRM 기반 정규화를 적용하여 잡음 특징의 영향을 제거합니다.
IRSS는 PACS, OfficeHome, NICO 데이터셋에서 기존 방법들을 뛰어넘는 성능을 보였습니다. 특히 Grad-CAM++ 시각화를 통해 IRSS가 스타일과 잡음 특징을 효과적으로 분리할 수 있음을 확인하였습니다.
Stats
스타일 분포 정렬을 위한 적대적 손실 ℓadv는 다음과 같이 정의됩니다:
ℓadv(θf, θs) = −1/N ∑N
i=1 log Fs(Ff(xi; θf); θs)ˆsi
IRM 기반 정규화를 위한 손실 D(e, θf, θy)는 다음과 같이 정의됩니다:
De
IRMv1 = ∇w|w=1.0ℓERM(w · θf, 1; De)2
De
BIRM = ∑(xi,yi)∈De [ln p(yi | θf, θe
y) - ln p(yi | θf, θy)]