Core Concepts
시간 계열 데이터에서 특정 접두사 패턴과 관련된 모든 공동 발생 순서 보존 패턴을 효율적으로 발견하는 것이 핵심 목표이다.
Abstract
이 논문은 시간 계열 데이터에서 공동 발생 순서 보존 패턴(COP)을 발견하는 COP-Miner 알고리즘을 제안한다. COP-Miner는 세 부분으로 구성되어 있다:
키포인트 추출: 시간 계열 데이터의 지역 극값점을 추출하여 왜곡을 줄이고 중복 패턴 발견을 방지한다.
준비 단계: 첫 번째 마이닝 라운드를 준비하는 단계로, 접두사 패턴의 발생 횟수, 접미사 패턴의 발생 횟수, 그리고 모든 융합 패턴의 발생 횟수를 계산한다.
반복적인 지지도 계산 및 빈번한 COP 마이닝: 접두사 및 접미사 패턴의 발생 횟수를 이용하여 상위 패턴의 지지도를 효율적으로 계산하고, 빈번한 COP를 마이닝한다.
실험 결과, COP-Miner는 다른 경쟁 알고리즘에 비해 실행 시간과 확장성이 우수하며, 키포인트 정렬을 사용한 COP가 더 나은 예측 성능을 보인다.
Stats
시간 계열 데이터 t에서 키포인트 시간 계열 k를 추출하는 데 걸리는 시간 복잡도는 O(N).
접미사 패턴 s의 발생 횟수를 계산하는 데 걸리는 시간 복잡도는 O(|𝑂𝑐𝑐s|).
접두사 패턴 o의 발생 횟수를 검증하는 데 걸리는 시간 복잡도는 O(|𝑂𝑐𝑐s|).
모든 융합 패턴의 발생 횟수를 계산하는 데 걸리는 시간 복잡도는 O(|𝑂𝑐𝑐s|log|k|).
상위 패턴의 지지도를 계산하는 데 걸리는 시간 복잡도는 O(|𝑂𝑐𝑐o|+|𝑂𝑐𝑐f|).
Quotes
"COP-Miner는 다른 경쟁 알고리즘에 비해 실행 시간과 확장성이 우수하며, 키포인트 정렬을 사용한 COP가 더 나은 예측 성능을 보인다."
"COP 마이닝은 사용자가 특정 접두사 패턴에 관심이 있는 경우 더 효과적이다."