Core Concepts
クラスタリングの品質と説明可能性の両方を考慮して、クラスタリングを構築する。クラスタの特性を考慮しつつ、クラスタ間の違いを強調する説明を提供する。
Abstract
本論文では、クラスタリングの品質と説明可能性の両方を考慮した新しい説明可能なクラスタリング手法ECSを提案する。
データは特徴空間Fと記述子空間Bの2つの視点で表現される。
クラスタの説明は、クラスタの特性を表すカバレッジと、他のクラスタとの違いを表す弁別性の2つの観点から評価される。
ECSは以下の4つのステップから成る:
複数のベースパーティションの生成
各クラスタの頻出パターンの計算
制約に違反するクラスタの除去
制約を満たすクラスタとパターンの選択(制約プログラミングを用いて解決)
事前知識を様々な形で統合できる。
3つの新しい説明の質の評価指標を導入した。
Stats
クラスタ内の要素をカバーするパターンの割合は、クラスタの大きさの70%以上である。
クラスタ間の弁別性は、他のクラスタの要素を30%以下しかカバーしないパターンで表現される。
クラスタリングレベルの弁別性は、選択されたクラスタの50%以下しかカバーしないパターンで表現される。
Quotes
"クラスタリングの品質と説明可能性の両方を考慮して、クラスタリングを構築する必要がある。"
"クラスタの特性を考慮しつつ、クラスタ間の違いを強調する説明を提供する。"
"事前知識を様々な形で統合できる。"