Core Concepts
효율적이고 안전한 시험 시간 모델 적응을 위해 모델 불확실성 감소와 데이터 불확실성 재보정을 수행한다.
Abstract
본 연구는 시험 시간 모델 적응(TTA) 문제를 다룬다. TTA는 학습 데이터와 시험 데이터 간의 분포 차이를 해결하기 위해 시험 데이터를 활용하여 모델을 적응시키는 기법이다.
기존 TTA 방법들은 다음과 같은 한계를 가진다: 1) 각 시험 샘플마다 역전파를 수행해야 하므로 계산 비용이 높다, 2) 분포 변화에 강인해지는 대신 기존 데이터에 대한 성능이 크게 저하된다(망각 문제), 3) 불확실한 데이터에 대해서도 과도하게 확신적인 예측을 한다.
이를 해결하기 위해 본 연구는 다음과 같은 기법을 제안한다:
효율적 적응을 위해 신뢰도와 다양성이 높은 시험 샘플만 선별하여 역전파를 수행한다.
중요 가중치의 변화를 제한하는 피셔 정규화를 통해 망각 문제를 완화한다.
모델 불확실성과 데이터 불확실성을 구분하여 각각 감소와 재보정을 수행한다.
제안 방법인 EATA와 EATA-C는 기존 방법 대비 높은 성능과 효율, 그리고 보정된 불확실성 추정 능력을 보인다.
Stats
시험 데이터 중 저엔트로피 샘플이 고엔트로피 샘플보다 적응에 더 큰 기여를 한다.
시험 데이터 중 예측 레이블이 서브 네트워크와 일치하지 않는 샘플은 데이터 불확실성이 높다.
Quotes
"기존 엔트로피 최소화 기반 시험 시간 적응 방법들은 데이터 불확실성을 간과하여 과도하게 확신적인 예측을 한다."
"모델 불확실성과 데이터 불확실성을 구분하여 각각 감소와 재보정을 수행하는 것이 중요하다."