이 논문은 그래프 임베딩 알고리즘에서 노드 간 비유사성을 보존하는 방법을 다룬다. 기존의 Skip-Gram Negative Sampling (SGNS) 방식은 노드 간 비유사성을 직접적으로 반발시키는 방식으로, 노드 수가 많은 경우 계산 복잡도가 높다는 문제가 있다.
저자들은 이 문제를 해결하기 위해 차원 정규화 방식을 제안한다. 차원 정규화는 임베딩 차원들의 평균을 0으로 유지하여 노드 간 비유사성을 간접적으로 보존한다. 이는 노드 수에 비해 차원 수가 훨씬 적기 때문에 계산 복잡도가 낮다.
저자들은 먼저 기존 Skip-Gram 손실 함수에서 노드 간 반발 항이 차원 정규화와 등가임을 수학적으로 증명한다. 이를 바탕으로 SGNS 대신 차원 정규화를 사용하는 알고리즘 증강 프레임워크를 제안한다. 이 프레임워크는 기존 LINE과 node2vec 알고리즘에 적용되어 성능 저하 없이 훈련 시간을 크게 단축시킨다.
실험 결과, 제안한 알고리즘 증강 기법은 기존 알고리즘 대비 훈련 시간을 크게 단축하면서도 링크 예측 성능을 유지하거나 향상시킨다. 특히 그래프 연결성이 높은 경우 제안 기법이 기존 방식보다 우수한 성능을 보인다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by David Liu,Ar... lúc arxiv.org 05-02-2024
https://arxiv.org/pdf/2405.00172.pdfYêu cầu sâu hơn