Core Concepts
HGNNの特有の実行パターンと高度な並列性およびデータ再利用性を活用することで、従来のGPUに比べて大幅な高速化と省電力化を実現する。
Abstract
本論文では、ヘテロジニアスグラフニューラルネットワーク(HGNN)の特性を定量的に分析し、その結果に基づいて高性能なHGNNアクセラレータ「HiHGNN」を提案している。
HGNNは、構造情報とセマンティック情報の両方を捉えるために、以下の4つの主要な実行ステージから構成される:
セマンティックグラフ構築(SGB)ステージ: 元のヘテログラフをセマンティックグラフに分割する
特徴量射影(FP)ステージ: 各セマンティックグラフ内の各頂点の特徴量をMLPを用いて変換する
近傍集約(NA)ステージ: 各セマンティックグラフ内の各頂点の近傍特徴量を集約する
セマンティック融合(SF)ステージ: 全てのセマンティックグラフの集約結果を融合する
分析の結果、HGNNの各ステージには異なる実行制限があり、ステージ間の並列性とデータ再利用性が高いことが明らかになった。
そこで提案するHiHGNNアクセラレータでは以下の3つの手法を導入している:
実行制限を考慮したステージ融合: ステージ間の実行制限を意識してステージを細分化・融合し、パイプライン実行を可能にする
独立性を考慮した並列実行: セマンティックグラフ間の並列処理を最大限に活用する
類似性を考慮した実行スケジューリング: セマンティックグラフ間のデータ再利用性を最大化する
これらの手法により、従来のGPUに比べて平均40.0倍の高速化と99.59%の省電力化を実現している。
Stats
セマンティックグラフ構築(SGB)ステージは全体の26.5%、近傍集約(NA)ステージは68.7%、セマンティック融合(SF)ステージは4.8%の実行時間を占める。
特徴量射影(FP)ステージは演算集約型、近傍集約(NA)ステージはメモリ集約型、セマンティック融合(SF)ステージは最初は演算集約型、後にメモリ集約型となる。
Quotes
"HGNNs have achieved excellent prediction accuracy in the processing of HetG and become at the heart of a broad range of critical fields [10], [61], [70], [78] such as recommendation systems [11], [29], medical analysis [39], knowledge inference [3], [55], [60], malicious account detection [38], information retrieval [41], shop search [42], etc."
"Guided by our findings, we propose a high-performance HGNN accelerator, HiHGNN, to alleviate the execution bound and exploit the newfound parallelism and data reusability in HGNNs."