Core Concepts
不確定データベースから効率的に順序パターンを発見するための新しい枠組みを提案する。理論的に厳密な上界値を使ってパターン探索空間を大幅に削減し、階層的なデータ構造を用いて候補パターンを効率的に管理する。また、増分的なデータベースにも対応可能な手法を提案する。
Abstract
本研究では、不確定データベースから効率的に順序パターンを発見するための新しい枠組みを提案している。
まず、パターン探索空間を大幅に削減するための理論的に厳密な上界値を3つ提案している。これらの上界値は既存手法よりも tight であり、より少ない候補パターンを生成できる。
次に、候補パターンを効率的に管理するための階層的データ構造「USeq-Trie」を提案している。USeq-Trieを用いることで、パターンの期待サポートを高速に計算できる。
これらの提案手法を組み合わせた「FUSP」アルゴリズムにより、不確定データベースから効率的に順序パターンを発見できる。
さらに、増分的なデータベースにも対応可能な「InUSP」手法を提案している。InUSPは、既存の増分的な順序パターンマイニング手法の課題を解決し、より完全な結果を得ることができる。
実験評価の結果、提案手法は既存手法と比べて候補パターンの生成数が大幅に少なく、高速に動作することを示している。また、増分的なデータベースに対しても優れた性能を発揮することが確認された。
Stats
不確定データベースにおける順序パターンの期待サポートの上界値は、maxPr(パターンの最大確率) × Σ(各シーケンスにおける最大確率)で表される。
加重期待サポートの上界値は、期待サポートの上界値 × パターンの重み上界値で表される。