Core Concepts
데이터셋 변화에 따른 다항 분류 모델의 성능 저하를 완화하기 위해 희소 결합 변화(Sparse Joint Shift) 모델을 활용하여 모델 예측 성능을 개선할 수 있다.
Abstract
이 논문은 다항 분류 문제에서 데이터셋 변화에 대한 효율적인 분석 방법을 제안한다.
주요 내용은 다음과 같다:
데이터셋 변화를 모델링하는 희소 결합 변화(Sparse Joint Shift) 개념을 소개하고 이에 대한 수학적 분석을 제공한다.
희소 결합 변화가 성립하는 경우, 타깃 데이터셋의 클래스 사후 확률을 보정하는 수식을 도출한다.
희소 결합 변화의 식별 가능성에 대한 결과를 제시하며, 이를 통해 클래스 사전 확률을 추정할 수 있다.
희소 결합 변화와 공변량 변화의 관계를 심층적으로 분석한다.
기존에 제안된 희소 결합 변화 추정 알고리즘의 문제점을 지적하고 개선 방안을 제안한다.
이를 통해 데이터셋 변화에 강건한 다항 분류 모델 개발을 지원할 수 있다.
Stats
데이터셋 변화로 인해 클래스 사전 확률 P[Ai]와 클래스 조건부 특징 분포 Pi[H]가 변화할 수 있다.
희소 결합 변화 하에서는 클래스 조건부 특징 분포 Qi[H|F]가 Pi[H|F]와 동일하다.
Quotes
"Sparse joint shift (SJS) was recently proposed as a tractable model for general dataset shift which may cause changes to the marginal distributions of features and labels as well as the posterior probabilities and the class-conditional feature distributions."
"We present new results on the transmission of SJS from sets of features to larger sets of features, a conditional correction formula for the class posterior probabilities under the target distribution, identifiability of SJS, and the relationship between SJS and covariate shift."