このコンテンツは、高次元データの分類問題を対象としている。具体的には、データをより高次元の特徴空間に拡張し、その上で確率的に選択された射影方向にデータを射影して1次元のデータを得る。その1次元データに対してしきい値分類を行い、n個の分類器を得る。その中から最も良い分類器を選択するという手法について分析している。
主な内容は以下の通り:
一般化誤差の上界を示し、この手法の一般化性が高いことを示した。特に、VC次元が大きい従来の分類手法に比べて、一般化誤差が小さくなることを示した。
射影の数nを十分に大きくすれば、この手法の分類精度がベイズ分類器に漸近的に収束することを示した。これは、特徴空間の多項式拡張次数kを大きくすることで実現できる。
実験では、この手法が高次元かつクラスが混在するデータセットにおいて、過学習を抑えつつ良好な一般化性を示すことを確認した。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Mireille Bou... lúc arxiv.org 09-12-2024
https://arxiv.org/pdf/2108.06339.pdfYêu cầu sâu hơn