Основні поняття
본 연구에서는 분포에 강건한 학습 기법과 안전한 스크리닝 기법을 결합하여 데이터 분포 변화에 강건한 불필요한 샘플 및 특성을 식별하는 방법을 제안한다.
Анотація
이 연구에서는 분포에 강건한(Distributionally Robust, DR) 학습 기법과 안전한 스크리닝(Safe Screening, SS) 기법을 결합하여 데이터 분포 변화에 강건한 불필요한 샘플 및 특성을 식별하는 방법을 제안한다.
DR 학습 기법은 데이터 분포 변화에 강건한 모델을 개발하는 기법이며, SS 기법은 모델 학습 전에 불필요한 샘플 및 특성을 식별하는 기법이다.
제안하는 방법인 분포에 강건한 안전한 스크리닝(Distributionally Robust Safe Screening, DRSS) 기법은 DR 학습 문제를 가중치 경험적 위험 최소화 문제로 재정식화하고, 가중치 불확실성을 고려하도록 SS 기법을 확장한다. 이를 통해 사전에 정의된 분포 범위 내에서 발생할 수 있는 모든 미래 분포에 대해 불필요한 샘플 및 특성을 안전하게 식별할 수 있다.
제안 기법의 이론적 보장을 제공하고, 합성 데이터와 실제 데이터를 이용한 수치 실험을 통해 성능을 검증한다.
Статистика
데이터 분포 변화에 따른 가중치 변화 범위 S가 클수록 더 많은 샘플 및 특성을 안전하게 식별할 수 있다.
정규화 강도 λ가 클수록 더 많은 샘플 및 특성을 안전하게 식별할 수 있다.
Цитати
"본 연구에서는 분포에 강건한 학습 기법과 안전한 스크리닝 기법을 결합하여 데이터 분포 변화에 강건한 불필요한 샘플 및 특성을 식별하는 방법을 제안한다."
"제안하는 DRSS 기법은 DR 학습 문제를 가중치 경험적 위험 최소화 문제로 재정식화하고, 가중치 불확실성을 고려하도록 SS 기법을 확장한다."
"DRSS 기법은 사전에 정의된 분포 범위 내에서 발생할 수 있는 모든 미래 분포에 대해 불필요한 샘플 및 특성을 안전하게 식별할 수 있다."