본 연구 논문에서는 대규모 그래프에서 그래프 신경망 (GNN)을 학습할 때 발생하는 이력 임베딩의 부실 문제를 해결하기 위한 새로운 학습 알고리즘인 REST (REducing STaleness)를 제안합니다.
GNN은 그래프 구조 데이터에서 뛰어난 성능을 보여주지만, 대규모 그래프에 적용할 때 확장성 문제에 직면합니다. 이를 해결하기 위해 이력 임베딩 방법들이 제안되었지만, 이는 과거 모델 매개변수로 계산된 부실한 특징 정보를 사용하기 때문에 성능 저하를 야기합니다.
REST는 순방향 및 역방향 단계를 분리하고 실행 빈도를 조정하여 특징 부실 문제를 해결합니다. 즉, 모델 매개변수보다 메모리 테이블을 더 자주 업데이트하여 최신 정보를 유지합니다. 또한, 노드의 중요도를 고려한 샘플링 전략인 REST-IS를 통해 중요 노드의 임베딩을 우선적으로 업데이트하여 성능을 더욱 향상시킵니다.
본 논문에서는 REDDIT, ogbn-arxiv, ogbn-products 등의 대규모 그래프 데이터셋을 사용하여 REST 알고리즘의 성능을 평가했습니다. 실험 결과, REST는 기존 이력 임베딩 방법들보다 우 우수한 예측 성능과 빠른 수렴 속도를 보였습니다. 특히, 대규모 데이터셋과 작은 배치 크기에서 더욱 뚜렷한 성능 향상을 나타냈습니다.
본 연구는 대규모 그래프에서 GNN 학습 시 발생하는 이력 임베딩의 부실 문제를 해결하는 효과적인 방법을 제시합니다. REST 알고리즘은 기존 방법들과 비교하여 우수한 성능과 효율성을 제공하며, 다양한 GNN 모델 및 샘플링 방법에 적용 가능한 확장성을 제공합니다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Rui Xue, Ton... lúc arxiv.org 10-10-2024
https://arxiv.org/pdf/2410.05416.pdfYêu cầu sâu hơn