Core Concepts
不均衡データセットを分類する際、バランシング手法はモデルの予測多様性を増大させる可能性がある。
Abstract
本研究では、不均衡分類問題におけるバランシング手法のラショーモン効果を調査しました。主な結果は以下の通りです:
バランシング手法はラショーモンセットの予測多様性(アンビギュイティとディスクレパンシー)を増大させる。
バランシング手法はモデルの変数重要度順序の違いには大きな影響を与えない。
部分的リサンプリングはラショーモン効果を軽減する解決策とはならない。
パフォーマンス向上とラショーモン効果のトレードオフをモニタリングするために、拡張版のパフォーマンス向上プロットを提案した。
これらの結果から、バランシング手法を使用する際は、モデル選択の際の予測多様性の影響を考慮する必要があることが示唆されます。拡張版のパフォーマンス向上プロットは、責任あるモデリングプロセスを行う上で有用なツールとなります。
Stats
バランシング手法を適用すると、ラショーモンセットのアンビギュイティとディスクレパンシーが増加する。
バランシング手法は、モデルの変数重要度順序の違いにはほとんど影響を与えない。
部分的リサンプリングはラショーモン効果を軽減する解決策とはならない。
Quotes
"バランシング手法はラショーモンセットの予測多様性(アンビギュイティとディスクレパンシー)を増大させる。"
"バランシング手法はモデルの変数重要度順序の違いには大きな影響を与えない。"
"部分的リサンプリングはラショーモン効果を軽減する解決策とはならない。"