Conceitos essenciais
既存のキャリブレーション指標は、予測の真実性を適切に評価できない場合があり、予測モデルがシステムを悪用することを許してしまう可能性がある。本論文では、サンプリングに基づく新たな指標を提案し、その有効性を示す。
Resumo
キャリブレーション指標の真実性に関する研究論文の概要
Haghtalab, N., Qiao, M., Yang, K., & Zhao, E. (2024). Truthfulness of Calibration Measures. arXiv preprint arXiv:2407.13979v2.
本研究は、逐次予測におけるキャリブレーション指標の真実性を検証することを目的とする。具体的には、既存の指標が予測モデルの真実性を適切に評価できるか、そして予測モデルがシステムを悪用できるような抜け穴が存在するかを調査する。