核心概念
本稿では、データストリームのトポロジー特性の変化を考慮した、新しいコンセプトドリフト検出手法を提案する。これは、従来の統計的な変化に基づく検出とは異なり、データの形状や構造の変化を捉えることで、より本質的な変化を検出することを目指す。
要約
永続的エントロピーとトポロジー保存に基づく、教師なしの景観変化評価
本研究は、データストリームにおける分布変化、特にトポロジー特性の変化を検出するための新しい教師なしフレームワークを提案する。従来の統計的な変化に基づくコンセプトドリフト検出とは異なり、本研究では、データの形状や構造といった本質的な変化を捉えることを目的とする。
提案手法は、次元削減、埋め込み、トポロジー特徴表現、統計分析の4つのステップから構成される。まず、高次元データを低次元空間に射影するために、トポロジー保存写像である自己組織化マップ(SOM)を用いる。次に、潜在空間内の各データ点について、クラスタ中心との距離行列を計算し、幾何学的特性を埋め込む。そして、各データチャンクについて、距離行列を用いてパーシステント図を計算し、トポロジー特徴を表現する。最後に、各チャンクのパーシステントエントロピーを計算し、マンホイットニーU検定を用いて、連続するチャンク間の有意な変化を検出する。