本論文は、不均衡データ分類の問題に関する評価指標の選択について議論している。一般的に使用される集約指標には曖昧性や偏りがあり、特定の指標を最適化するだけでは望ましくない。
そこで本論文では、Fβ指標を用いた視覚化ツール「Fβ-plot」を提案する。Fβ-plotは、βパラメータの値の変化に伴う各分類器のFβ値の変化を可視化し、ユーザーの要求に応じた最適な分類器を特定することができる。
実験では、複数の不均衡データセットに対して様々な過剰サンプリング手法を適用し、Fβ-plotによる分析を行った。その結果、データセットや分類器の特性に応じて、最適な分類器が異なることが示された。Fβ-plotは、ユーザーの要求に応じた分類器の選択を支援する有用なツールであると考えられる。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen