本論文では、Equilibrium K-Meansアルゴリズムを提案している。従来のK-Meansアルゴリズムには、データの真の分布が不均衡な場合に性能が劣化するという問題がある。これは、K-Meansアルゴリズムが各クラスタのサイズを均等化しようとするためである。
Equilibrium K-Meansは、クラスタ間の反発力を導入することで、この問題を解決する。具体的には、データ点とクラスタ中心の距離に応じて、クラスタ中心に働く引力と反発力のバランスを取ることで、大きなクラスタの中心に集まるのを防ぐ。
提案手法は、従来のHard K-Means、Fuzzy K-Means、Maximum-Entropy Fuzzy Clusteringなどのアルゴリズムを包含する一般化された枠組みの中に位置づけられる。また、Equilibrium K-Meansは、勾配降下法を用いて効率的に最適化できる。
実験では、合成データおよび10種類の実データを用いて、提案手法の有効性を確認している。特に、不均衡データに対してEquilibrium K-Meansが優れた性能を示すことが分かった。さらに、深層クラスタリングへの適用においても、従来手法に比べて大幅な精度向上が得られることを示した。
A otro idioma
del contenido fuente
arxiv.org
Consultas más profundas