本論文では、時系列データから希少だが高い信頼性を持つ時間パターンを効率的に発掘する手法を提案している。
まず、時系列データを記号列に変換し、時間情報を含む時間シーケンスデータベースを構築する。次に、以下の3つのステップで希少時間パターンを発掘する:
単一イベントの発掘: 最小サポート閾値を満たすイベントを抽出する。
2イベントパターンの発掘: 最小サポートと最小信頼度を満たす2イベントパターンを発掘する。効率化のため、Apriori原理と時間的推移性に基づく2つの剪定手法を提案する。
k-イベントパターンの発掘 (k≥3): 上記の2つの剪定手法を拡張し、k-イベントパターンを効率的に発掘する。
提案手法は、階層的ハッシュ構造を用いて効率的なイベントおよびパターンの検索を実現し、さらに剪定手法を組み合わせることで、大幅な高速化を達成している。
実験評価では、提案手法が既存手法に比べ、実行時間とメモリ使用量の両面で大幅な性能改善を示している。また、抽出された希少時間パターンの分析から、興味深い知見が得られることが確認された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Van Ho Long,... at arxiv.org 09-10-2024
https://arxiv.org/pdf/2409.05042.pdfDeeper Inquiries