Centrala begrepp
ガウシアンミクスチャーモデルにおけるセミ教師あり分類問題のベイズリスクを計算し、既知のアルゴリズムの振る舞いを理解する。
Sammanfattning
本論文では、ラベル付けが不確実なセミ教師あり分類問題を考える。主な目的は以下の2点:
-
不確実なラベル付けの場合のベイズリスクを計算する。先行研究[9]の手法を応用する。
-
この最適なベイズリスク bound を用いて、[7]で提案されたアルゴリズムの振る舞いをさらに理解する。アルゴリズムの性能がこの最適bound に近いことが知られているため。
具体的には以下の結果を示す:
- ベイズリスクは√quに収束する。ここでquは(7)式で定義される。
- qvは(8)式で定義され、ラベルの不確実性を表すεiの関数となる。
- 近似式(11)を用いると、qvはラベル付けの確実性を表す¯ε2と、教師なしデータの有用性を表すF(qu)の和で表される。
- 教師なしデータの有用性F(qu)は、タスクの難易度(ベイズリスク)にのみ依存する。
- 教師あり学習と比べたセミ教師あり学習の誤り率の改善度は、SNRλと次元比cに依存する。
Statistik
ベイズリスクは√quに収束する。
qu = λ λcqv / (1 + λcqv)
qv = lim n→∞ (1/n) Σ Fεi(qu)