Core Concepts
다양한 관련 학습 과제들이 존재하는 상황에서 과제 간 공유되는 구조를 활용하여 데이터 효율적으로 학습하는 방법을 제안한다. 이를 통해 개별 과제의 예측 성능을 향상시킬 수 있다.
Abstract
이 논문은 다중 과제 학습 문제를 다룬다. 다양한 관련 학습 과제들이 존재하는 상황에서 이들 간 공유되는 구조를 활용하여 데이터 효율적으로 학습하는 방법을 제안한다.
주요 내용은 다음과 같다:
각 과제의 예측 모수를 공통 모수와 과제별 희소 편향으로 분해하는 희소 이질성 가정을 도입한다.
이를 활용하여 두 단계로 구성된 강건 다중 과제 학습 추정기(RMEstimator)를 제안한다.
첫 번째 단계에서는 강건 통계 기법인 trimmed mean을 사용하여 공통 모수를 추정한다.
두 번째 단계에서는 LASSO 회귀를 사용하여 과제별 편향을 제거한다.
제안한 RMEstimator의 오차 한계를 분석하여, 기존 방법 대비 특히 데이터가 부족한 과제에서 지수적 성능 향상을 보인다.
제안 방법을 온라인 학습 문제인 맥락 밴딧에 확장하여 RMBandit 알고리즘을 제안하고, 이의 누적 후회 한계를 분석한다.
합성 데이터와 실제 데이터에 대한 실험을 통해 제안 방법의 유용성을 입증한다.
Stats
각 과제 j의 표본 공분산 행렬 b
Σj의 최소 고유값 λmin(b
Σj)은 ψ 이상이다.
각 과제 j의 노이즈 ϵi는 σj-subgaussian 분포를 따른다.