מושגי ליבה
불확실한 데이터베이스에서 가중치 있는 순차적 패턴을 효율적으로 마이닝하는 새로운 프레임워크를 제안한다. 이 프레임워크에서는 가중치 있는 기대 지지도라는 새로운 개념을 도입하고, 정적 및 증분 데이터베이스에서 가중치 있는 순차적 패턴을 마이닝하기 위한 효율적인 알고리즘을 개발한다.
תקציר
이 논문은 불확실한 데이터베이스에서 가중치 있는 순차적 패턴을 마이닝하기 위한 새로운 프레임워크를 제안한다.
- 가중치 있는 기대 지지도라는 새로운 개념을 도입하여 가중치 제약을 마이닝 프로세스에 통합한다.
- 정적 불확실 데이터베이스에서 가중치 있는 순차적 패턴을 마이닝하기 위한 효율적인 알고리즘 FUWS를 개발한다.
- 증분 불확실 데이터베이스에서 가중치 있는 순차적 패턴을 마이닝하기 위한 두 가지 새로운 기술 uWSInc와 uWSInc+를 제안한다.
- 패턴을 효율적으로 유지하기 위한 계층적 인덱스 구조 USeq-Trie를 개발한다.
- 기대 지지도와 가중치에 대한 두 가지 새로운 상한 측정치 expSupcap과 wgtcap을 제안한다.
- 검색 공간을 줄이기 위한 새로운 측정치 wExpSupcap을 제안한다.
- 제안된 접근 방식의 효율성과 효과성을 입증하기 위한 광범위한 실험을 수행한다.
סטטיסטיקה
불확실한 데이터베이스에서 가중치 있는 순차적 패턴을 마이닝하는 것은 중요한 문제이다.
기존 알고리즘은 정적 데이터베이스에 국한되어 있어 증분 데이터베이스에 효율적이지 않다.
제안된 FUWS 알고리즘은 정적 불확실 데이터베이스에서 가중치 있는 순차적 패턴을 효율적으로 마이닝할 수 있다.
uWSInc와 uWSInc+ 기술은 증분 불확실 데이터베이스에서 가중치 있는 순차적 패턴을 효율적으로 마이닝할 수 있다.
ציטוטים
"불확실한 데이터의 사용이 급격히 증가함에 따라 불확실한 데이터베이스에서 패턴을 마이닝하는 것이 연구자들의 관심을 끌고 있다."
"모든 빈번한 시퀀스가 동등하게 중요한 것은 아니다. 따라서 다른 가중치가 다른 항목에 할당된다."
"대부분의 실제 데이터베이스는 동적 성격을 가지고 있다. 따라서 증분 마이닝에 대한 효율적인 방법이 필요하다."