Core Concepts
본 논문은 쿼리 그래프의 데이터 그래프 내 모든 동형 임베딩의 수를 효율적으로 추정하는 새로운 알고리즘 FaSTest를 제안한다. FaSTest는 (1) 샘플 공간을 크게 줄이는 강력한 필터링 기술, (2) 정확하고 효율적인 추정을 위한 적응형 트리 샘플링 알고리즘, (3) 어려운 인스턴스에 대한 최악의 경우 최적 성능의 계층화된 그래프 샘플링 알고리즘을 결합한다.
Abstract
본 논문은 쿼리 그래프의 데이터 그래프 내 모든 동형 임베딩의 수를 효율적으로 추정하는 새로운 알고리즘 FaSTest를 제안한다.
필터링 기술: FaSTest는 삼각형 안전성, 사이클 안전성, 엣지 이분 안전성 등의 새로운 안전 조건과 유망한 후보 우선 필터링 전략을 통해 기존 알고리즘보다 훨씬 더 compact한 후보 공간을 구축한다.
샘플링 기술: FaSTest는 (1) 컴팩트한 후보 공간에서 균일하게 트리 샘플링을 수행하고, (2) 어려운 경우에 대해 계층화된 그래프 샘플링을 적용한다. 이를 통해 기존 방법들보다 훨씬 더 정확하고 효율적인 추정 결과를 얻을 수 있다.
이론적 분석: FaSTest의 필터링 단계는 최악의 경우에도 최적의 시간 복잡도를 보장한다.
실험 결과, FaSTest는 기존 샘플링 기반 방법들보다 최대 2배, GNN 기반 방법들보다 최대 3배 더 정확한 결과를 보여준다.
Stats
쿼리 그래프 𝑞의 정점 수가 8개일 때, WordNet 데이터셋(약 80,000개 정점)에서 임베딩 수가 744개에서 4.7 × 10^15개까지 크게 변화한다.
기존 알고리즘들은 일반적으로 최대 10^3 ~ 10^5개의 임베딩만 계산한다.
Quotes
"쿼리 그래프의 데이터 그래프 내 모든 동형 임베딩의 수를 효율적으로 추정하는 것이 시급한 과제이다."
"FaSTest는 (1) 샘플 공간을 크게 줄이는 강력한 필터링 기술, (2) 정확하고 효율적인 추정을 위한 적응형 트리 샘플링 알고리즘, (3) 어려운 인스턴스에 대한 최악의 경우 최적 성능의 계층화된 그래프 샘플링 알고리즘을 결합한다."