Core Concepts
이기적 그래프 신경망(HGNN)의 실행 패턴과 성능 병목을 분석하고, 병렬성과 데이터 재사용성을 활용하여 HGNN을 효율적으로 가속화하는 HiHGNN 가속기를 제안한다.
Abstract
이 논문은 이기적 그래프 신경망(HGNN)의 실행 패턴과 성능 병목을 분석하고, 이를 바탕으로 HGNN을 효율적으로 가속화하는 HiHGNN 가속기를 제안한다.
HGNN은 이기적 그래프(HetG)의 구조 정보와 의미 정보를 모두 활용하기 위해 4단계로 구성된다: 1) 의미 그래프 생성, 2) 특징 투영, 3) 이웃 집계, 4) 의미 융합.
분석 결과, HGNN의 각 단계는 서로 다른 실행 한계를 가지며, 의미 그래프 간 병렬성과 데이터 재사용성이 높은 기회를 제공한다.
이를 바탕으로 HiHGNN은 다음과 같은 기법을 제안한다:
실행 한계를 고려한 단계 융합 기법: 단계 간 파이프라인 실행을 통해 하드웨어 자원 활용도를 높인다.
독립성 기반 병렬 실행 설계: 의미 그래프 간 병렬성을 효과적으로 활용한다.
유사성 기반 실행 스케줄링: 의미 그래프 간 데이터 재사용성을 극대화한다.
이를 통해 HiHGNN은 기존 GPU 대비 평균 40.0배 가속과 99.59% 에너지 절감을 달성한다.
Stats
HGNN의 FP 단계는 연산 한계에 직면하며, NA 단계는 메모리 한계에 직면한다.
FP 단계의 sgemm 커널은 95.9%의 피크 성능을 달성하지만 DRAM 대역폭 활용은 33.6%에 그친다.
NA 단계의 SpMMCsr 커널은 3.9%의 피크 성능만 달성하지만 DRAM 대역폭 활용은 74.3%에 달한다.
Quotes
"HGNNs have achieved excellent prediction accuracy in the processing of HetG and become at the heart of a broad range of critical fields [10], [61], [70], [78] such as recommendation systems [11], [29], medical analysis [39], knowledge inference [3], [55], [60], malicious account detection [38], information retrieval [41], shop search [42], etc."
"Guided by our findings, we propose a high-performance HGNN accelerator, HiHGNN, to alleviate the execution bound and exploit the newfound parallelism and data reusability in HGNNs."