Core Concepts
그래프 구조에서 허브 노드의 특성을 고려한 랜덤 워크 기반 그래프 임베딩 방법을 제안하여 노드 분류 성능을 향상시킨다.
Abstract
이 논문은 그래프 구조 데이터에 대한 기계 학습 기법 중 하나인 노드 분류 문제를 다룬다.
노드 분류 문제는 그래프의 일부 노드에 라벨이 주어져 있을 때, 나머지 노드의 라벨을 예측하는 것이다.
노드 분류를 위한 세 가지 주요 접근법은 집단 추론 방법, 그래프 임베딩 기반 방법, 그래프 신경망 방법이다.
그래프 임베딩 기반 방법은 분류 정확도와 계산 효율성 사이의 적절한 절충을 제공한다.
기존 그래프 임베딩 알고리즘은 일반적인 목적으로 설계되었지만, 이 논문에서는 노드 분류 문제에 특화된 두 가지 새로운 허브 기반 랜덤 워크 그래프 임베딩 방법을 제안한다.
제안된 방법은 랜덤 워크 샘플링 과정에서 허브 노드에 특별한 주의를 기울인다.
실험 결과, 제안된 방법은 기존 노드2벡 알고리즘에 비해 다양한 분류 모델의 성능을 크게 향상시킨다.
Stats
그래프의 평균 노드 차수는 2.52에서 31.13 사이이다.
그래프의 노드 차수 표준편차는 3.75에서 47.28 사이이다.
그래프의 최대 노드 차수는 17에서 1434 사이이다.
Quotes
"그래프 구조에서 허브 노드는 전체 연결성에 가장 중요한 역할을 한다."
"허브 노드 중에서도 '좋은 허브'와 '나쁜 허브'를 구분할 수 있다."