本論文では、機械学習モデルの安定性を評価するための新しい基準を提案する。この基準は、最適輸送理論に基づいた分布摂動分析を用いて、データ汚染と部分集団シフトの両方を考慮する。
具体的には、観測データに対する最小限の摂動を見つけ、それによってモデルのリスクが所定のしきい値を超えるようにする。この摂動は、サンプルと密度の両方に関する最適輸送距離を用いて定量化される。
提案手法の実用性を高めるため、様々な損失関数に対する具体的な凸最適化問題を示す。また、強双対定理を用いることで、最適な摂動分布の構造を明らかにする。
実験では、収入予測、健康保険予測、COVID-19死亡率予測の各タスクに提案手法を適用し、モデルや特徴量の安定性を評価する。結果は、提案手法が実世界のシナリオにおけるモデルの信頼性と公平性を評価する上で有用であることを示している。
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Jose Blanche... às arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03198.pdfPerguntas Mais Profundas