이 논문은 기계 학습 모델의 성능 평가를 위해 합성 데이터를 활용하는 자동 평가(AutoEval) 방법론을 제안한다.
먼저 정확도, 손실 함수 등 다양한 지표를 추정하는 방법을 설명한다. 이를 위해 예측 기반 추론(Prediction-Powered Inference, PPI) 기법을 활용하여 소량의 사람 레이블 데이터와 대량의 합성 데이터를 결합하여 편향되지 않고 분산이 낮은 추정량을 얻는다.
다음으로 모델 간 상대적 성능 비교를 위해 Bradley-Terry 모델을 활용하는 방법을 제안한다. 이 경우에도 PPI 기법을 통해 AI 생성 선호도 데이터를 활용하여 통계적으로 타당한 추정량을 얻을 수 있다.
실험 결과, 제안 방법론은 기존 접근법에 비해 더 정확한 성능 추정, 더 작은 분산, 더 좁은 신뢰구간을 제공한다. 또한 모델 순위 추정 정확도도 크게 향상된다.
이 방법론은 모델 평가 비용을 크게 줄이면서도 통계적 타당성을 확보할 수 있어, 실제 배포 환경에서 모델의 정확도, 공정성 등을 종합적으로 평가하는 데 유용할 것으로 기대된다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania