본 연구는 노드와 간선 수가 가변적인 그래프 데이터 스트림에 대해 점진적 학습 및 프로토타입 기반 임베딩을 활용하여 분류하는 새로운 방법을 제안한다. 또한 개념 drift 탐지 메커니즘을 통해 모델을 지속적으로 업데이트한다.
그래프 데이터 프로파일링을 위해 그래프 생성 종속성(GGD)을 자동으로 발견하는 GGDMiner 프레임워크를 제안한다. GGDMiner는 그래프 데이터의 구조와 속성 간 상관관계를 설명할 수 있는 GGD 집합을 발견한다.
본 연구는 그래프 데이터에서 일부 정상 노드의 레이블이 주어진 반감독 학습 기반 이상치 탐지 문제를 다룬다. 제안하는 접근법 GGAD는 정상 노드의 국소 구조와 표현을 활용하여 이상치 노드를 생성하고, 이를 통해 정상 노드 기반 판별 일반화 분류기를 효과적으로 학습한다.
본 논문에서는 계층적 분해를 활용하여 대규모 그래프에 대한 효과적인 표현을 학습하는 새로운 신경망 아키텍처인 Shift Aggregate Extract Networks(SAEN)를 제안한다.
그래프 데이터의 부분 레이블 학습 문제를 해결하기 위해 잠재적 원인 추출 기법을 활용하여 노이즈가 있는 레이블에도 효과적으로 학습할 수 있는 모델을 제안한다.
대규모 언어 모델은 텍스트 기반 데이터에 비해 그래프 구조 데이터 처리에 한계가 있지만, 다양한 모달리티(텍스트, 모티프, 이미지)를 활용하면 그래프 이해 및 노드 분류 성능을 향상시킬 수 있다.
엣지 교란은 그래프 신경망 네트워크의 성능에 상반된 영향을 미치는데, 이는 어떤 엣지를 우선적으로 교란하는지에 따라 달라진다. 증강 방법은 중요도가 낮은 엣지를 제거하여 모델의 일반화 성능을 높이고, 공격 방법은 핵심 연결을 파괴하여 정확도를 떨어뜨린다.