Core Concepts
본 연구는 노드와 간선 수가 가변적인 그래프 데이터 스트림에 대해 점진적 학습 및 프로토타입 기반 임베딩을 활용하여 분류하는 새로운 방법을 제안한다. 또한 개념 drift 탐지 메커니즘을 통해 모델을 지속적으로 업데이트한다.
Abstract
본 연구는 그래프 데이터 스트림 분류를 위한 새로운 방법을 제안한다. 이 방법은 다음과 같은 특징을 가진다:
노드와 간선 수가 가변적인 그래프 데이터 스트림을 다룰 수 있다.
점진적 학습을 통해 모델을 지속적으로 업데이트한다.
각 클래스의 대표 그래프(프로토타입)를 선택하고 이를 활용해 그래프 임베딩을 생성한다.
개념 drift 탐지 메커니즘을 통해 drift 발생 시 프로토타입을 재계산한다.
제안 방법의 성능을 평가하기 위해 다양한 그래프 데이터셋을 사용하였다. 실험 결과, 제안 방법이 기존 방법에 비해 우수한 성능을 보였다. 특히 개념 drift가 발생하는 환경에서 프로토타입 재계산을 통해 성능 향상을 확인할 수 있었다.
Stats
그래프 데이터셋의 노드 수와 간선 수는 시간에 따라 변화한다.
Letter 데이터셋의 경우 300개의 그래프에 대해 distortion이 없었고, 이후 450개의 그래프에 대해 높은 수준의 distortion이 적용되었다.
GREC 데이터셋의 경우 다양한 distortion 수준의 그래프로 구성되어 있다.
Fingerprint 데이터셋은 'arch'와 'left' 두 클래스의 그래프로 구성되어 있다.