核心概念
確率的射影分類法は、高次元データの分類において、単純な構造にもかかわらず、最適なベイズ分類器に収束する可能性がある。
要約
このコンテンツは、高次元データの分類問題を対象としている。具体的には、データをより高次元の特徴空間に拡張し、その上で確率的に選択された射影方向にデータを射影して1次元のデータを得る。その1次元データに対してしきい値分類を行い、n個の分類器を得る。その中から最も良い分類器を選択するという手法について分析している。
主な内容は以下の通り:
一般化誤差の上界を示し、この手法の一般化性が高いことを示した。特に、VC次元が大きい従来の分類手法に比べて、一般化誤差が小さくなることを示した。
射影の数nを十分に大きくすれば、この手法の分類精度がベイズ分類器に漸近的に収束することを示した。これは、特徴空間の多項式拡張次数kを大きくすることで実現できる。
実験では、この手法が高次元かつクラスが混在するデータセットにおいて、過学習を抑えつつ良好な一般化性を示すことを確認した。
統計
高次元データにおいて、確率的射影分類法の一般化誤差の上界は、VC次元が大きい従来手法に比べて小さい。
確率的射影の数nを十分に大きくすれば、分類精度がベイズ分類器に収束する。
引用
"Considering the simplicity of the thresholding after random projection classification method, Occam's razor principle suggests that such a classifier should be used for any training dataset that can be well classified after a random projection, as one expects the resulting classifier to generalize well."
"We show that this type of classifier is extremely flexible as, given full knowledge of the class conditional densities, under mild conditions, the error of these classifiers would converge to the optimal (Bayes) error as k and n go to infinity."