이 논문은 기계 학습 모델의 안정성 평가를 위한 새로운 접근법을 제안한다. 모델의 성능이 실제 배포 환경에서 저하되는 문제를 해결하기 위해, 저자들은 최소 분포 교란 기준을 도입한다. 이 기준은 관측된 데이터에 대한 최소한의 교란으로 인해 모델 성능이 사전에 정의된 수준까지 저하되는 것을 측정한다.
저자들은 최적 수송(OT) 거리와 모멘트 제약을 사용하여 이 교란을 정량화한다. 이를 통해 데이터 오염과 하위 집단 변화라는 두 가지 주요 분포 변화 유형을 모두 다룰 수 있다. 또한 다양한 손실 함수에 대한 실용적인 볼록 최적화 문제 공식화를 제시한다.
실험 결과는 제안된 안정성 평가 기준이 다양한 실제 응용 분야에서 모델 및 특징의 안정성을 비교하고, 모델 성능 향상을 위한 전략을 제공할 수 있음을 보여준다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Jose Blanche... ב- arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03198.pdfשאלות מעמיקות