Core Concepts
動的環境におけるクラスタリングは、リアルタイムデータ分析、オンラインの教師なし学習、動的施設配置問題など、幅広い応用分野を持つ重要な課題である。しかし、動的特性を持つ多様で制御可能な基準データセットの不足により、動的環境におけるクラスタリングアルゴリズムの体系的な評価が困難であった。本研究では、動的ガウシアンコンポーネントを用いた動的データセット生成ジェネレータ(DDG)を提案し、時間的・空間的な重大度、パターン、影響範囲が異なる様々な動的シナリオをシミュレートできるようにした。
Abstract
本論文では、動的環境におけるクラスタリングの重要性と課題について述べている。
クラスタリングは、データ内の潜在的な構造を発見し、事前知識なしでパターンや関係性を明らかにする重要な教師なし学習手法である。
動的環境におけるクラスタリングは、静的環境に比べてさらに複雑な課題である。データ、分布、クラスター数などが時間とともに変化するためである。
動的最適化問題(DOP)の枠組みでクラスタリングを捉えると、最適なクラスタリング解を継続的に追跡する必要がある。
メタヒューリスティックアルゴリズムは静的クラスタリングに有効だが、動的環境への適用は十分に検討されていない。
その主な理由は、動的特性を持つ多様な基準データセットの不足である。
そこで本研究では、動的ガウシアンコンポーネントを用いた動的データセット生成ジェネレータ(DDG)を提案した。
DDGは、時間的・空間的な重大度、パターン、影響範囲が異なる様々な動的シナリオをシミュレートできる。
DDGは、動的クラスタリングアルゴリズムの体系的な評価を可能にし、実世界の動的課題への適用を促進する。
Stats
データ次元数 d(t)は時間とともに変化する。
各ガウシアンコンポーネントiの重み w(t)
i は時間とともに変化する。
各ガウシアンコンポーネントiの標準偏差 σ(t)
i,j は時間とともに変化する。
各ガウシアンコンポーネントiの回転角度 θ(t)
i,j,k は時間とともに変化する。