核心概念
ベルカーブサンプリングは、不確実性サンプリングと受動学習を凌駕し、異なるデータセットで優れたパフォーマンスを示す。
要約
典型的な教師あり学習において、ラベル付きと未ラベルのインスタンスの取得コストが異なる場合、アクティブラーニングが提案されています。この論文では、不確実性サンプリングと受動学習について説明し、新しいラベルを取得するためにベルカーブ重み関数を使用する提案が行われました。シミュレーション結果は、多様なAUR値を持つほとんどのデータセットで、ベルカーブサンプリングが受動学習や不確実性サンプリングよりも優れたパフォーマンスを示すことを示しています。
統計
95%エリアの下限: 0.3920, 上限: 0.6080(𝛼 = 𝛽 = 5)
95%エリアの下限: 0.4241, 上限: 0.5759(𝛼 = 𝛽 = 10)
パッシブラーニングと同等のパフォーマンス(𝛼 = 𝛽 = 1)
不確実性サンプリングと同等のパフォーマンス(高い𝛼および𝛽値)
引用
"通常、教師あり学習モデルは未ラベル化されたインスタンスをランダムに選択して注釈付けされます。"
"不確実性サンプリングは、受動的学習よりも少ないラベル付きインスタンスを使用して効率的に教師あり学習を向上させる方法です。"
"我々は新しいデータセットについて事前知識がない場合、受動的学習または不確実性サンプリングどちらを使用するか判断することが困難です。"