전략적 분류에서 알려지지 않은 사용자 비용에 대한 강건한 분류기를 학습하는 방법을 제안한다. 이를 위해 비용 불확실성 집합에 대한 최소 최대 문제를 정의하고, 효율적인 알고리즘을 제시한다.
온라인 전략적 분류 문제에서 학습자는 에이전트의 전략적 행동에도 불구하고 에이전트의 실제 라벨을 정확하게 예측하는 분류기를 찾는다. 이를 위해 학습자는 에이전트의 조작된 특징 벡터에 대한 예측 오류와 조작 횟수를 최소화하고, 최대 마진 분류기를 복구하는 알고리즘을 제안한다.
전략적 행동을 하는 개인들의 예측 불가능한 결과를 고려하여 의사결정자가 최적의 정책을 수립할 수 있는 방법을 제안한다.
전략적 에이전트의 피드백에 따라 모델을 재학습하면 에이전트의 수락률은 증가하지만 실제 자격률은 감소할 수 있다. 또한 이는 알고리즘 공정성에도 부정적인 영향을 미칠 수 있다.
본 논문에서는 분류기 학습 과정에서 발생하는 전략적 행위자들의 상호 작용과 외부 효과를 고려한 새로운 전략적 분류 모델을 제안하고, 이 모델에서 학습의 이론적 토대와 효율적인 학습 방법을 제시합니다.