本論文は、高次元大規模データに対するクラスタリングの課題を解決するため、ブロック対角構造を持つ類似グラフを構築し、その特性を活用したDBSCANクラスタリング手法を提案している。
具体的には以下の3つのステップから成る:
グラフ構築: 高次元データの線形部分空間構造に基づき、ブロック対角構造を持つ類似グラフを構築する。これにより、クラスタ間の類似度が低く、クラスタ内の類似度が高いグラフを得ることができる。
グラフ並べ替え: DBSCANに着想を得た密度ベースのクラスタ探索アルゴリズムを用いて、グラフ上のクラスタを順次発見し、それに基づいてグラフを並べ替える。これにより、ブロック対角構造が明確になる。
ブロック同定: 並べ替えられたグラフ上で、効率的にブロック対角構造を同定する。これにより、クラスタ構造を自動的に抽出できる。
提案手法は、高次元大規模データに対して、パラメータ依存性が低く、様々な密度のクラスタを発見でき、凸・非凸クラスタの両方に対応可能、クラスタリング過程の可視化が可能、ロバストな性能を発揮するなどの特長を持つ。実験では、従来手法を大きく上回る性能を示している。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Zheng Xing,W... في arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01341.pdfاستفسارات أعمق