Core Concepts
잠재 변수 U의 변화로 인한 분포 변화 상황에서 관측 가능한 프록시 변수 W와 개념 변수 C를 활용하여 목표 도메인의 최적 예측기 EqrY | xs를 식별할 수 있다.
Abstract
이 논문은 잠재 변수 U의 변화로 인한 분포 변화 상황에서 도메인 적응 문제를 다룬다. 기존의 공변량 변화(covariate shift) 및 레이블 변화(label shift) 가정으로는 이러한 상황을 다룰 수 없다.
저자들은 프록시 인과 학습(proximal causal learning) 기법을 활용하여, 잠재 변수 U를 명시적으로 모델링하지 않고도 목표 도메인의 최적 예측기 EqrY | xs를 식별할 수 있는 방법을 제안한다.
두 가지 설정을 고려한다:
개념 병목(Concept Bottleneck): 소스 도메인에서 프록시 W와 개념 변수 C가 관측되고, 목표 도메인에서 X, C, W가 관측되는 경우
다중 도메인(Multi-Domain): 소스 도메인에서 W, X, Y가 관측되고, 목표 도메인에서 X, W가 관측되는 경우
두 경우 모두 프록시 변수를 활용하여 EqrY | xs를 식별할 수 있음을 보인다. 또한 커널 기반 추정 방법을 제안하여 실험적으로 검증한다.
Stats
잠재 변수 U의 분포 변화로 인해 모든 주변 분포 PpV q ‰ QpV q, V Ď tW, X, C, Yu가 달라진다.
프록시 W는 U에 대한 간접적인 정보를 제공한다.
개념 변수 C는 X와 Y 사이의 관계를 매개한다.
Quotes
"Neither the covariate shift nor the label shift assumptions apply."
"Our approach to adaptation employs proximal causal learning, a technique for estimating causal effects in settings where proxies of unobserved confounders are available."