Core Concepts
그래프 트랜스포머의 메모리 문제를 해결하기 위해 정규화된 주의 점수를 활용하여 성능을 향상시킬 수 있다.
Abstract
이 논문은 그래프 신경망의 한계인 과도한 메모리 사용 문제를 해결하기 위한 방법을 제안한다. 그래프 트랜스포머는 장거리 의존성을 잘 포착할 수 있지만, 메모리 사용이 많은 단점이 있다. 이를 해결하기 위해 저자들은 "엣지 정규화" 기법을 제안한다.
그래프 트랜스포머 레이어에서 계산된 주의 점수 행렬을 캐싱한다.
주의 점수 행렬과 실제 인접 행렬 간의 차이를 손실 함수로 사용하여 정규화한다.
이 정규화 손실은 주의 메커니즘의 매개변수에만 영향을 미치도록 하여 노드 표현 학습에 방해되지 않도록 한다.
실험 결과, 이 정규화 기법은 포지션 인코딩을 사용하지 않는 경우 성능을 안정적으로 향상시킬 수 있었다. 하지만 포지션 인코딩과 함께 사용하면 성능이 저하되는 경우도 있었다. 저자들은 이 기법이 포지션 인코딩을 완전히 대체할 수는 없지만, 그래프 트랜스포머의 메모리 문제를 해결하는 데 도움이 될 것으로 기대한다.
Stats
그래프 트랜스포머의 메모리 사용량이 MPNN 대비 매우 크다.
포지션 인코딩을 추가하면 메모리 사용량이 더 증가한다.
Quotes
"그래프 트랜스포머는 메모리 소비가 심각한 문제이다."
"포지션 인코딩을 추가하면 메모리 문제가 더 악화된다."