Centrala begrepp
本論文では、ハードクラスタリングの一般的なアプローチである k-MLE を開発し、その収束性を示す。k-Bregman クラスタリングは k-MLE の特殊ケースであり、初めて完全な収束性の証明を与える。さらに、ベクトル自己回帰時系列のクラスタリングに k-VARs を適用し、その収束性と計算アルゴリズムを提案する。
Sammanfattning
本論文では以下の内容が示されている:
- k-MLE: ハードクラスタリングの新しい一般的アプローチ
- 従来のハードクラスタリング手法は距離や発散に基づいていたが、k-MLE は尤度に基づいているため適用範囲が広い
- k-Bregman クラスタリングは k-MLE の特殊ケースであり、初めて完全な収束性の証明を与える
- k-VARs: ベクトル自己回帰時系列のクラスタリング
- 時系列の自己相関構造を考慮したクラスタリングアルゴリズム
- 計算効率化のためのQR分解やCholesky分解を利用
- 情報量基準(BIC)を用いたモデル選択手法を提案
- 理論的解析
- k-MLE の収束性を示し、部分最大値と局所最大値の関係を明らかにする
- k-VARs の収束性は最小二乗推定量の一意性に基づいて示される
- シミュレーションと実データ分析
- シミュレーションデータでk-VARsが既存手法に比べ優れた性能を示す
- 実データ(WAFER)分析でも k-VARs が最良の結果を得る
本論文は、ハードクラスタリングの新しい一般的アプローチ k-MLE を提案し、その理論的解析と応用例を示したものである。特に、時系列クラスタリングにおいて k-VARs が優れた性能を発揮することが明らかになった。
Statistik
時系列の次元数 m は2、4、8を使用
時系列長 T は80
クラスター数 K は8
クラスターあたりの時系列数 Nc は30