المفاهيم الأساسية
カーネル関数を用いたk-Meansクラスタリングの計算コストを大幅に削減するため、入力データセットからサイズの小さなコアセットを構築する。
الملخص
本論文では、一般的なカーネル関数に対して、サイズがポリノミアルに抑えられるコアセットの構築手法を提案している。
- カーネル k-Means問題は、データ点をカーネル空間に写像してクラスタリングを行うため、計算コストが高くなる課題がある。
- 提案手法では、入力データセットからサイズがポリノミアルに抑えられるコアセットを構築する。
- コアセットを用いることで、カーネル k-Meansの目的関数を(1±ε)の精度で近似できる。
- コアセットの構築アルゴリズムは、近線形時間で動作し、メモリ使用量も小さい。
- 提案手法を用いることで、カーネル k-Means++アルゴリズムの高速化や、スペクトラルクラスタリングの高速化が可能となる。
- 実験結果では、提案手法が様々なデータセットやカーネル関数に対して優れた性能を示すことを確認している。
الإحصائيات
入力データセットのサイズがnの場合、提案手法のコアセットのサイズはポリノミアルに抑えられる(poly(kε^-1))。
コアセットの構築時間は近線形時間(˜O(nk))である。