核心概念
高い確信度を持つ分類インスタンスのみを使用することが望ましい場合、精度や再現率などの指標を評価するリジェクト曲線が提案されている。
要約
分類シナリオにおける高確信度インスタンスの評価には、精度リジェクト曲線(ARC)が提案されている。
精度や再現率などの指標を使用して、新たなリジェクト曲線である再現率リジェクト曲線と適合率リジェクト曲線を提案している。
プロトタイプベースの分類器を使用して、提案された曲線を人工ベンチマークデータで検証し、ARCと比較してより正確な洞察を提供している。
適合率と再現率は、不均衡なデータセットでの分類器パフォーマンスに関する洞察を提供する有用な手法であることが示されている。
導入
安全性重視アプリケーションにおける信頼性向上が重要。
拒否オプションは不確実な分類データポイントを拒否し、アプリケーションへの信頼性向上に貢献。
関連作業
Chow氏は最適認識エラーと拒否トレードオフについて初めて紹介した。
ARCsは拒否オプション付き分類器の比較に広く使用されている。
プロトタイプベース分類
特徴空間をVoronoiセルに分割し、各セルごとに責任プロトタイプが割り当てられる。
GMLVQやLGMLVQなどの拡張モデルが提案されており、効果的な学習手法であることが示されている。
リジェクトオプション
分類器用の拒否オプションは確実性測定値rと閾値θで定義され、全体的または局所的な拒否しきい値が設定可能。
評価方法
ARCsは受容または拒否レート関数として分類性能を表示し、精度や再現率よりも他の評価メトリックが好ましい場合もあることが示唆されている。
PRCやRRCは不均衡データセットで有益な情報提供可能。
統計
ARCs [22] は受容レート計算時に正解陽性(TPθ)および真陰性(TNθ)を示す。
PRC(θ) : [0, 1] → [0, 1], |Xθ| / |X| 7→ TPθ / (TPθ + FPθ)
RRC(θ) : [0, 1] → [0, 1], |Xθ| / |X| 7→ TPθ / (TPθ + FNθ)