Core Concepts
ランダムに初期化されたニューラルネットワークの出力を分析することで、データストリームにおけるコンセプトの変化を検出する教師なしの手法を提案する。
Abstract
本論文では、ランダムに初期化されたニューラルネットワークの出力を分析することで、データストリームにおけるコンセプトの変化を検出する教師なしの手法「Parallel Activations Drift Detector (PADD)」を提案している。
PADD は、ニューラネットワークの各出力における過去と現在の分布の統計的な差異を検出することで、コンセプトドリフトを特定する。具体的には、ニューラネットワークの各出力に対して複数回の統計的検定を行い、一定数の検定で有意差が検出された場合にドリフトと判断する。
提案手法は、ラベルを必要とせずに完全に教師なしで動作する。また、ニューラネットワークの初期状態の特性を活用することで、決定境界の変化に依存せずに一般的な分布の変化を捉えることができる。
実験では、様々な特徴量数やドリフトの特性を持つ合成データストリームを用いて、提案手法と教師あり・教師なしの既存手法を比較評価した。その結果、PADD は他手法と比べて優れたドリフト検出性能を示すことが確認された。
Stats
データストリームは250個のバッチに分割され、各バッチには200個のサンプルが含まれる。
ストリームには3、5、10、15個のドリフトが含まれ、ドリフトの動態は突発的または漸進的である。
ストリームの特徴量数は30、60、90個(うち30%が有意)である。
各設定のストリームは10回生成された。